O poveste pe care am tot uitat s-o scriu, referitoare la faptul că marile site-uri din România și-au omorât arhiva la numeroasele relansări din ultimii trei ani. Asta, în condițiile în care pe net au circulat tot felul de acuzații de SEO Spam.
Prin primăvara trecută, când dădeam zor să termin Cum să devii un Nimeni, am avut nevoie de date despre nunta Andreei Esca și a lui Alexandre Eram. Am dat ca tot omul un Google și am ajuns la o concluzie oarecum previzibilă: dintre cele câteva site-uri de ziare/conținut care existau în 2000, numai “Ziua” și “Adevărul” mai aveau sus pagina respectivă.
Povestea m-a frapat, fiindcă scandalul legat de SEO Spam era proaspăt. Vă amintiți poate că acum vreun an, câteva mari site-uri din România au început să-și arunce în cap acuzații referitoare la pagini făcute ca să fie indexate aiurea de Google. În principiu, poți să creezi mai multe pagini ca să atragi mai mult trafic prin Google, dar stau și mă gândesc la ce-a folosit asta cât timp paginile create erau goale sau irelevante. Nu sunt specialist în SEO (definiția din Wikipedia, pentru cine nu știe), dar impresia mea e că artificii de felul ăsta te pot ajuta, dincolo de considerentele morale, să vinzi Viagra pe un site mic, și nu să crești cu un site content-intensiv. Sunt curios ce ar spune un om mai avizat ca mine în materie.
Internetul progresa, cu alte cuvinte. Majoritatea site-urilor renunțaseră la platformele pe care stătuseră până prin 2005 și realizaseră diferite relansări și face lifturi. Dacă de pildă Realitatea nu are ce face cu ceea ce-a existat pe .tv înainte de 2004, EVZ, Ziua, Adevărul și altele asemenea există pe alocuri de prin 1997-1998.
Odată cu relansările, majoritatea site-urilor de felul ăsta au rămas fără arhivă. La EVZ.ro nu pot nici măcar să-mi găsesc articolele scrise prin 2005, deși prin 1998 site-ul era faimos și prin 2001 de acolo a pornit “Cântarea Americii”, editorialul lui Nistorescu care a făcut înconjurul lumii.
În principiu, dacă ar găsi o soluție de integrare a paginilor vechi, care se află probabil undeva pe niște servere, managerii de new media din marile grupuri ar obține, onest, exact ceea ce încearcă să facă SEO spammerii: un număr imens – de ordinul milioanelor – de pagini indexabile de Google, dar relevante și fără probleme. Bugetele investite în diferite optimizări, unele dubioase, ar putea fi folosite pentru integrarea conținutului vechi în platformele noi.
De asta se leagă și problema căutării pe site-urile respective. Eu unul am ajuns să caut aproape numai pe Google, cu “cuvinte căutate site:cutare.ro”. Dac-aș fi rău aș spune că toate relansările de site-uri din România seamănă cu vopsirea gardului.
P.S.: De anul trecut, de când am căutat-o pe Esca, a dispărut și pagina de pe Adevarul.ro, relansat între timp. Singurul loc în care mai găsești nunta cu Eram e pe Ziua.net. Bine că acolo sunt șanse mici să se repeadă cineva, ca să dreagă mașinăria… 🙂
Exact asa am ajuns si eu sa caut. Si e enervant si fara logica, atat din perspectiva businessului, cat si a consumatorului. Partea funny e ca am gasit ceea ce cautam in paginile agregatoarelor si nu in cele ale ziarelor cu pricina
Cat: cel puțin la EVZ.ro, care și-a curățat vreo 8-9 ani de existență pe net, numai acolo se mai găsesc.
Fara pretentia de a rezolva ceva din fondul problemei, poti sa cauti (ceva) din vechituri aici: http://www.archive.org/web/web.php
Calm, baieti, mult calm !
1. In primul si in primul rind Google o sa-i arda de nu se vad daca apeleaza la asemenea măgării. Motorul de cautare Google este mult mai destept decit multi SEO-spammeri.
2. Nu-i bai daca unii sterg paginile vechi. Eu am o vorba: daca ai scos odata capul pe internet te-ai ars ! Exista destui care sa inregistreze tot ce mișcă.
Va dau doar un singur exemplu:
http://www.archive.org/web/web.php
Iulian, ia cauta pe acolo, poate gasesti…
(am pus si eu vreo doua diacritice, unde era absolut necesar)
Ia uite cu ce ma distrez eu acum:
http://web.archive.org/web/20070116093321/www.comanescu.ro/swot-jurnalismonlinero.html
Mersi de workaround-uri, sunt mai multe moduri de a afla o informație. Dacă n-aș fi găsit nimic pe net, aș fi scris la PR la Pro TV în chestiunea “nunta Escăi”. Totuși, asta nu scutește site-urile de arhivă 🙂
Asa este ! Nu invat eu pe un om de media pe unde sa caute, mai ales ca despre archive .org se vorbeste chiar in linkul amintit de mine.
Problema care se pune: e corect sa aflam informatii din acest gen de site-uri ? E corect sa indexeze ele ce vrem si ce nu vrem ? Discutam degeaba ! Aceste site-uri exista si isi vor face mereu treaba.
De unde concluzia mea de mai sus.
Iar daca acele site-uri (amintite de Iulian) nu mai afiseaza pagini din arhiva lor ne putem pune intrebarea: nu mai vor sau nu mai pot ? Cine stie ce server a crapat pe undeva si pe el erau toate datele, ca e greu si scump sa faci back-up !
Mariane, e destul de simplu: când relansezi site-ul, asta se întâmplă pe o platformă nouă, de obicei php + mysql. Paginile vechi sunt în vechea bază de date, ca să imporți tot trebuie un program dedicat și niște timp. În principiu, beneficiarul nu se uită la treaba asta sau lasă pe mai târziu. Așa ajungem aici, unde suntem.
“ În principiu, beneficiarul nu se uită la treaba asta sau lasă pe mai târziu“
SAU NU VREA.