Groovy > Youtube-felhasználó feltöltéseinek listázása

Azért ez a Groovy ijesztő tud lenni. Ijesztően egyszerű.

[code]
def u = 'HungarianDemocrat'
def f = new URL('http://gdata.youtube.com/feeds/api/users/'+u+'/uploads').getText('UTF-8')

def XmlParser_yt = new XmlParser().parseText(f)

XmlParser_yt.entry.each {

println it.title.text()
def arraylist = it.link.findAll {
it."@rel".contains('alternate')}

url = arraylist["@href"][0]

def command = 'python youtube-dl -t ' + url
def proc = command.execute()
proc.waitFor()

println "return code: ${ proc.exitValue()}"
println "stderr: ${proc.err.text}"
println "stdout: ${proc.in.text}"

}

[/code]

Szorgalmi feladatként a lapozást meg lehetne oldani, mert ez a megoldás csak az első 25 bejegyzést jeleníti meg. (Hint: link elem next attribútum rel értékkel)

Tehát jól nézne ki, ha a következőképp lehetne leszedni a videókat. Na persze, azóta már nem elérhetőek a videók. :D


for( page in yt_useruploads(user)){
     page.downloadAll()
}

Ahhoz, hogy ez működjön a yt_useruploads objektumpéldánynak implementálni kell az iterator() metódust, ami egy bejárót ad vissza. A bejárónak három metódust kell megvalósítani: a hasNext(), next() és remove() metódust. Egy ilyen bejárót az AbstractList egy belső privát osztályban valósít meg. Mivel Groovyban szkriptelünk, így ez a lehetőség nem elérhető.
Az iterator metódus objektumgyártóként funkcionál, így lehetne statikus is, de mivel az iterator metódusa paraméter nélküli, így nem tudjuk átadni neki a kezdő URL-t, kénytelenek vagyunk az osztályváltozóból kiolvasni, így bukva a statikusságot. Kurzorként az aktuális oldal URL-jét használjuk. Emellett eltároljuk osztályváltozóként azt az XmlReader példányt, amire a kurzor URL mutat, ez az actual.
A hasNext() első hívásánál az actual még nincs feltöltve, ezt kihasználva a kurzorban található URL-t lehívjuk, hogy van-e benne videó. Ha nincs, hamisat dobunk vissza. A lehívott URL mögötti XmlReader példányt eltároljuk későbbi használatra.
A next() metódus az actual-ból dolgozik. Kiszedi a következő lapra mutató linket, ezzel felülírja a kurzort majd visszaadja az actualt. Ha nincs következő link, a kurzor null-t kap és a hasNext() hamisat ad vissza.


class YTerator implements Iterator{
    
    def private actual    // XmlParser instance
    def private cursorURL // URL pointing to actual page
    
    def YTerator(startURL){
        this.cursorURL = startURL
    }
    def URLtoParser(url){
        new XmlParser().parseText(new URL(url).getText())
    }
    def boolean hasNext(){
        println '[+] hasNext'
        
        if (cursorURL == null) return false
        if (actual == null)     return true
        
        def arraylist = actual.link.findAll {
            it."@rel".contains('next')
        }	
        arraylist[0]==null?false:true
    }
    def next(){
        println '[+] next' 
        println ' +-- ' + cursorURL
        
        actual = URLtoParser(cursorURL)
        def arraylist = actual.link.findAll {
                    it."@rel".contains('next')
        }
        def newcursor =  arraylist["@href"][0]

        // stepping cursor
        cursorURL = newcursor
        actual
    }
    def void remove(){
    }
    def iterator(){
        new YTerator(cursorURL)
    }
}
/*** Usage ***/

def u = 'RamboZsolt'
def url = 'http://gdata.youtube.com/feeds/api/users/'+u+'/uploads'

println "[!] classic for Java operator"
for( XmlParser page :  new YTerator(url) ) {

    println "classic"
}
println "[!] groovy each"
new YTerator(url).each {

    println "each"
}
println "[!] groovy for..in operator"
for( page in new YTerator(url) ) {

    println "in"
}

Na, miután megvan a bejárónk, úgy találjuk, hogy nem az összes videót akarjuk letölteni, szeretnénk szűrni leírás alapján vagy cím alapján.



entry.grep { it.title.contains('hupikék törpikék') }

Ahol a kapcsos zárójel közötti rész egy klozúra(closure). Azt kell majd lenyomni szűrőként az iterator mélyére.

Infok:
[1] XML feldolgozás Groovyval, http://groovy.codehaus.org/Reading+XML+using+Groovy%27s+XmlParser
[2] Youtube feed protokoll a felhasználó feltöltéseinek lekérdezésére, http://code.google.com/apis/youtube/2.0/developers_guide_protocol.html#…
[3] Youtube-video letöltő szkript Pythonban, https://github.com/rg3/youtube-dl/raw/2010.12.09/youtube-dl
[4] Külső program meghívása, http://groovy.codehaus.org/Executing+External+Processes+From+Groovy

foofighter blogja
A hozzászóláshoz be kell jelentkezni
1089 megtekintés

durva, tenyleg, megtud egy kulso programot hivni, es xmlt parsolni. omg :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszönjük Emese.

0 szavazat

A hozzászóláshoz be kell jelentkezni

olyan dolgokra tudsz racsodalkozni, hogy nyugtass meg, nem programozo vagy:)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Kedvenc kis házi trollom, ha jól viselkedsz megsimogatom a buksidat.

0 szavazat

A hozzászóláshoz be kell jelentkezni

ennyit tudsz? :(

0 szavazat

A hozzászóláshoz be kell jelentkezni

s
----------------------------
színes ingyen domain domain

0 szavazat

A hozzászóláshoz be kell jelentkezni

Friss hozzászólások

>Mar 10 eve is csinaltam… 2025-09-01T08:57:34+0200
> hogy a podcasterek szerint… 2025-09-01T08:45:20+0200
Meghatalmazással… 2025-09-01T08:26:19+0200
tesztrendszer ahol az… 2025-09-01T08:23:05+0200
ujabb ertelmes hozzaszolas … 2025-09-01T08:18:29+0200
ügyfélkaput csak személyesen… 2025-09-01T08:02:53+0200
:DDD 2025-09-01T08:01:39+0200
Vagy már nem kell aggódnunk… 2025-09-01T07:59:11+0200
Persze, hogy hagyjuk, meg… 2025-09-01T07:47:03+0200
Szállásadó regisztrációnál… 2025-09-01T07:43:07+0200

Groovy > Youtube-felhasználó feltöltéseinek listázása

Hozzászólások