Ştiri:

Forumul RUFOn este din nou funcțional după ce a primit un upgrade important de software și rulează acum pe un server nou.

Main Menu

Cum copiem ...

Creat de fiulploii, 18 August 2011, 14:39:42

« precedentul - următorul »

0 Membri şi 1 Vizitator vizualizează acest subiect.

fiulploii

Deschid acest topic din dorinta de a ajuta vizitatorul sau poate vizitatorii  :evil: care de cateva nopti - dupa ora Romaniei - tipareste subiectele de pe forum .   :roll:

Pentru a economisi toner + electricitate + ... recomand programul HTTrack Website Copier 

http://www.softpedia.com/progDownload/HTTrack-Website-Copier-Download-5588.html 

iar aici ai un mic ghid de folosire

http://www.megaupload.com/?d=TAI4S8QG 

Ar fi indicat sa arhivezi cu 7-Zip si sa apesi pe optiunea de compresie, "Store". Daca nu transformi site-ul in arhiva, e posibil ca programul de inregistrat sa nu poata scrie corect toate acele sute, mii sau zeci de mii de fisiere din site .

Poate ca alti colegi forumisti au metode mai eficiente si ii rog sa le comunice ca sa ajutam un spirit sa poata sistematiza niste ''chestii''   :lol: 

:martiansmile: :-) :lol:


Siberia

@fiulploii, e ciudat daca te intreb despre ce vorbesti ?
Citat din: fiulploii din  18 August 2011, 14:39:42
Deschid acest topic din dorinta de a ajuta vizitatorul sau poate vizitatorii  :evil: care de cateva nopti - dupa ora Romaniei - tipareste subiectele de pe forum .   :roll:

Cine, ce, cum si de ce ? :D (ca sa inteleg si eu, please)
"The end is the beginning of all things, Suppressed and hidden, Awaiting to be released through the rhythm Of pain and pleasure." - Jiddu Krishnamurti

Xanadron

Eu inteleg cam asta cu slabu-mi neuron: :roll: la noi, serviciile din 3 litere n-au bani de hipercomputere (si fiindca li s-au marit salariile cu 40%, pe fundalul scaderilor generale :-P), iar accesul la retzeaua globala AI (Artifical Intelligence) le e interzis, din simplul motiv ca intruziva AI a aflat in numai 3 milisecunde ca-s prosti ca noaptea. :-D :lol: :-D

Problema-i insa alta acum: care-i AI-ul de l-a ajutat pe colegul fiulploii sa detecteze activitatea pomenita? :roll:
Trăim pe-o planetă nebună - opriţi-o să mă cobor !!!
http://povestoteca.wordpress.com/

Siberia

Doh, si eu care credeam ca cineva vrea sa scrie un scenariu de film SF fara sa verse o cota parte din castigurile viitoare :D
Daca e vorba doar despre 3 litere, m-am linistit :) Daca erau 4 incepeam sa-mi pun probleme  :-D
"The end is the beginning of all things, Suppressed and hidden, Awaiting to be released through the rhythm Of pain and pleasure." - Jiddu Krishnamurti

fiulploii

Citat din: Xanadron din  18 August 2011, 15:46:16

Problema-i insa alta acum: care-i AI-ul de l-a ajutat pe colegul fiulploii sa detecteze activitatea pomenita? :roll:

Explicatia esoterica . Am facut o investigatie in mai multe calatorii astrale , am verificat informatia prin RV si am deschis topicul  :lol: :lol: :lol:

Explicatia reala. Eu sunt pe alt fus orar asa ca deobicei intru tarziu in noapte , spre dimineata cand pe forum e doar cate un utilizator sau niciunul .
                       Daca esti logat pe forum si faci clic cu mouse-ul pe '' cine este online'' se deschide un tabel care iti arata fiecare pe ce topic este si ce face acolo : vizualizeaza, tipareste, scrie .
                       Nici un mister deci in privinta A.I.  :-D . Am observat cateva seri la rand cum un vizitator tot tipareste subiecte, unele din ele cu peste 10 pagini si no, fiind eu altruist din fire , m-am gandit sa-i dau un sfat  :wink: :lol:

Atat si nimic mai mult . Poate ca ar fi interesant daca ar fi pus si un detector de locatie dupa IP asa cum e pe unele site-uri  :roll:   

Xanadron

OK, fiulploii si-al dr. Watson :-D - eram gata sa te-ntreb daca nu l-ai intilnit si pe Iisus cu ocazia RV-sesiunii tale.

Sa nu fi fost, pe linia ideii Siberiei, generalissimul E. Strainu in documentare pentru a enshpea lui cartzulie "copy/paste". :roll:
Desi listarea (sub forma de anexe la rapoartele scrise) e practicata mai ales de... altii. 8-)
Trăim pe-o planetă nebună - opriţi-o să mă cobor !!!
http://povestoteca.wordpress.com/

Arhanghelul

Citat din: Xanadron din  18 August 2011, 19:56:26
OK, fiulploii si-al dr. Watson :-D - eram gata sa te-ntreb daca nu l-ai intilnit si pe Iisus cu ocazia RV-sesiunii tale.

Sa nu fi fost, pe linia ideii Siberiei, generalissimul E. Strainu in documentare pentru a enshpea lui cartzulie "copy/paste". :roll:
Desi listarea (sub forma de anexe la rapoartele scrise) e practicata mai ales de... altii. 8-)

http://ir.baidu.com/phoenix.zhtml?c=188488&p=irol-products ... ip ... http://www.ip-adress.com/ip_tracer/www.baidu.com
... google,msn,yahoo,etc. inteleg ...dar ...  alde dastia de te doare  capul ... baidu (cred ca n-a auzit nimeni de numele asta) ce cauta pe aici ... ce trafic si bani aduce ... oare stiu chinezoi romana ...
Prin credinta a fost mutat Enoh de pe pamânt, ca sa nu vada moartea. Si n-a mai fost gasit, pentru ca Dumnezeu îl mutase. Caci înainte de mutarea lui, primise marturia ca este placut lui Dumnezeu.   Evrei 11:05

Arhanghelul

#7
Ce face Baidu la ora 8 :30 AM (ora Beijing) ... a facut o pasiune pentru   http://www.rufon.org/forum/index.php?action=profile;u=596
Prin credinta a fost mutat Enoh de pe pamânt, ca sa nu vada moartea. Si n-a mai fost gasit, pentru ca Dumnezeu îl mutase. Caci înainte de mutarea lui, primise marturia ca este placut lui Dumnezeu.   Evrei 11:05

Xanadron

Citat din: Arhanghelul din  26 August 2011, 01:39:13
Ce face Baidu la ora 8 :30 AM (ora Beijing) ... a facut o pasiune pentru   http://www.rufon.org/forum/index.php?action=profile;u=596

Deloc inexplicabila pasiunea brusca a chinezoiului Baidu pentru profilul/nickname-ul cu rezonantze nipone al colegului Kymosabe, daca ne reamintim detaliul livrat de Nox parca nu demult - cum ca IP-ul computerului de pe care "conspecteaza" baidezul pe RUFOn e de fapt din Japonia. 8-)

Mai astept doar aparitia unui bot cu IP-ul in Xanadronia. :-D
Trăim pe-o planetă nebună - opriţi-o să mă cobor !!!
http://povestoteca.wordpress.com/

Siberia

Si dupa ce apar o diversitate de boti, sa trimitem si un virus cu IP din  Siberia sa-i trieze  :-D  :evil:
"The end is the beginning of all things, Suppressed and hidden, Awaiting to be released through the rhythm Of pain and pleasure." - Jiddu Krishnamurti

AndreiASM

Citat din: Xanadron din  26 August 2011, 12:01:21
Deloc inexplicabila pasiunea brusca a chinezoiului Baidu pentru profilul/nickname-ul cu rezonantze nipone al colegului Kymosabe, daca ne reamintim detaliul livrat de Nox parca nu demult - cum ca IP-ul computerului de pe care "conspecteaza" baidezul pe RUFOn e de fapt din Japonia. 8-)

Mai astept doar aparitia unui bot cu IP-ul in Xanadronia. :-D

Salutari tuturor,

Serviciile oferite de Baidu sunt valabile in China si Japonia, deci locatia serverului de pe care are loc crawling-ul nu e deosebita.

Un coforumist intreba de ce interesul subit pentru site-ul acesta (romanesc, fiind). Aici intervine un concpt IT-ist pe nume de TLD (Top Level Domain - domeniul de nivel maxim), care practic identifica un web-site din punct de vedere a categoriei; in acest caz, acest TLD este .org, si nu .ro. Din punct de vedere al paianjenului care efectueaza operatiunea automat, acesta nu este un site romanesc (nici localizarea serverelor in Romania nu ar ajuta, dat fiind ca un site poate fi oglindit sau replicat pe mai multe servere, distribuite uniform geografic, pentru a asigura viteza mare de raspuns.).

De ce in general noaptea tarziu? Aceasta are de-a face cu o politica generala a crawlerelor, care isi executa actiunile atunci cand loadul serverului tinta este minim (in cazul nostru, evident, noaptea exista mai putin trafic decat ziua).

De ce crawluieste in continuare? O indexare completa poate dura saptamani, chiar luni pentru site-urile mari si stufoase (nu as putea sa dau un ETA pe cand termina :D)

De asemenea, precizez de pe acum ca e foarte posibil ca micutul Baidu sa ne mai scotoceasca in viitor - tot o politica de-a crawlerelor, de a-si mentine actualizate datele de pe un anumit site (politica de revizitare).

De asemenea, anumite subiecte pot prezenta mai mult interes, dat fiind numarul mai mare de vizitatori, astfel ca vor fi preferate in dauna altora mai putin citite.

Sper ca am reusit sa elucidez intr-o oarecare masura misterul. Nu exista nimic deosebit la aceste evenimente (chiar daca sunt mai paranoic de felul meu cand vine vorba de conspiratii & co, stiu ca astfel de 'evenimente' sunt normale, IT-ist fiind).

Xanadron

Vorba ceea: cine stie, cunoaste... :wink:
Astea-s desigur explicatiile rationale, dar ma racaie in continuare unul din cele citeva adevaruri strecurate printre tonele de BS in "2012-The Movie" (v. sediul preparativelor global-centralizate pentru Apoca_lipsa - CHINA).

Nu stiu daca si ajutati de Baidu sau nu, chinejii inclin sa cred ca au si ei programe ample de prognoze pe baza de analiza semantica a fluxurilor globale de... cuvinte circulante pe net in definitiv. :roll:
E doar parerea mea, evident.
Trăim pe-o planetă nebună - opriţi-o să mă cobor !!!
http://povestoteca.wordpress.com/

Siberia

@AndreiASM o mica intrebare am si eu:

Cate crowlere de indexare (spiders) sunt programate sa tipareasca continutul unor subiecte ?
Macar sa ne facem si noi o idee.
"The end is the beginning of all things, Suppressed and hidden, Awaiting to be released through the rhythm Of pain and pleasure." - Jiddu Krishnamurti

AndreiASM

#13
Citat din: Siberia din  26 August 2011, 19:18:18
@AndreiASM o mica intrebare am si eu:

Cate crowlere de indexare (spiders) sunt programate sa tipareasca continutul unor subiecte ?
Macar sa ne facem si noi o idee.

Depinde. In general, pentru un singur motor de cautare, sunt lansate mai multe instante simultan care culeg informatiile de pe respectivul site (de obicei, atunci cand se viziteaza un site pentru prima data, se folosesc multe instante); totul depinde de cat de repede se doreste indexarea respectivului site si de latimea de banda (pentru a evita gatuirea serverului). Ulterior, cand se efectueaza revizitarile, se foloseste un numar mai mic. Chiar acum sunt 7 paianjeni de la MSN online, in captura de ecran postata erau parca 12 de la Baidu, numere care sunt cat se poate de in regula (un numar foarte mare pot gatui serios serverul).

In final, judecand la rece, totul este in regula. Bineinteles, cred ca nimeni si nimic nu impiedica o corporatie sa plateasca, de exemplu, pe cei de la Baidu ca sa extraga anumite date de pe un site, dar fiind date toate circumstantele prezente, eu as zice ca nu e niciun motiv de ingrijorare. Mai mult, daca chinezii (prin asta inteleg guvern, tPTB, sforari NWO, etc.) ar vrea sa obtina ceva informatii, cu toata puterea lor de calcul, as garanta ca nu ar apela la bietii Baidu (care sunt un soi de Yahoo asiatic) ca sa faca asta in locul lor, si ar folosi spideri invizibili, nume aleatoare de useri, etc., astfel incat sa treaca neobservati.  :martiansmile:

PS: Ca sa raspund la intrebare si scurt si la obiect, pot fi folosite si cateva zeci de instante pentru asa ceva (10, 20, 30 - depinde de mai multi factori pe care i-am enumerat deja in postul acesta & cel precedent).

Siberia

Multumesc mult, dar eu am intrebat :
CitatCate crowlere de indexare (spiders) sunt programate sa tipareasca continutul unor subiecte ?
Nu cate instante ale unui robot sunt pe pagina pentru a o indexa conform unui algoritm.

Sau ca sa fiu mai inteleasa: in algoritmii de indexare a robotilor/ crawlerelor de internet exista si optiunea de tiparire a unor informatii gasite pe baza respectivului algoritm de cautare pentru indexare ?
Si daca da, informatiile tiparite / printate folosesc pentru indexarea site-ului sau in alte scopuri ?
"The end is the beginning of all things, Suppressed and hidden, Awaiting to be released through the rhythm Of pain and pleasure." - Jiddu Krishnamurti