Parteneriatul Google-agenţii, o lovitură grea pentru ziare şi televiziuni

Am fost mai mult pe drumuri şi ieri, şi azi şi mă mir că nimeni nu a preluat încă ştirea referitoare la parteneriatul dintre Google News şi agenţii de presă ca Associated Press, Agence France-Presse, UK Press Association sau Canadian Press. Parteneriatul mi se pare mult mai important şi cu urmări mult mai clare şi rapide decât facilitatea care permite actorilor ştirii să adauge propriile comentarii, lansată acum câteva săptămâni. Ziarele şi televiziunile care toacă aceeaşi marfă de agenţie o s-o păţească şi iată de ce:

Asta înseamnă, în principiu, că Google News are acces cu o zi mai devreme decât până acum la ştirile din toată lumea, pentru că, fără parteneriatul cu agenţiile, acestea erau vizibile mai ales prin intermediul paginilor electronice ale ziarelor, care reproduceau adesea ediţia tipărită, iar aceasta prelua “mâine” depeşa de agenţie de “azi”. Desigur că multe ziare mari au pe net actualizare în timp real, la fel ca şi site-urile de televiziuni sau publicaţiile electonice, însă asta nu se întâmpla de fiecare dată.

Pe lângă “viteza de reacţie” obţinută în acest mod, Google News mai ascund o armă cu potenţial letal, în noua lansare: eliminarea “duplicatelor”. Despre ce e vorba: “White House Sex Scandal”, eveniment listat pe prima pagină din Google News, producea, pe stil vechi, 1254 de rezultate “cu duplicate incluse”, cel puţin la ora la care am dat eu search-ul. Fără duplicate, era vorba numai de 474 de rezultate. Cele două linkuri nu par prea diferite, în momentul de faţă, unui cititor “uman”, însă din punctul de vedere al algoritmilor scăderea de volum, de aproape două treimi, e notabilă; probabil că Google a ajuns la rezultat prin eliminarea unor linkuri la care duc la pasaje de text identice.

Cu alte cuvinte, 60 la sută din ce se scrie în presa mondială – sau “ştie” Google că se scrie – e balast, plagiat, copy şi paste? Răspunsul e, evident, negativ. În realitate, e vorba de aceleaşi depeşe ale agenţiilor de presă, mai ales de limbă engleză, de pe diferite site-uri de ziare şi televiziuni, unde se găsesc ad litteram. Sau cel puţin parţial, dar cu pasajele esenţiale comune, fiindcă la agenţii se practică scriitura “modulară”, “vagon”, în care poţi elimina o parte din ştire păstrând primele paragrafe sau schimba lead-ul (începutul), rămânând pe aceeaşi “bază” de text.

Toată treaba are sens pentru un anume ziar, dintr-o anume arie geografică, aflat într-un anumit context concurenţial. Cu alte cuvinte, “Miami Herald” cel de hârtie, din Florida, n-are nici o problemă cu faptul că “The Guardian”, din UK, dă aceeaşi ştire de agenţie. Treaba stă însă cu totul altfel pe internet, care se vede de oriunde.

Deocamdată, cum spuneam, pieptănarea asta nu se vede foarte bine cu ochiul liber, dar Google News a făcut, conceptual, un pas mare către “sinteza absolută”. Ceea ce înseamnă şi o lovitură grea pentru diverşii tocători de ştiri externe de genul “un avion a căzut în Pacific” sau “cei doi preşedinţi au stabilit că iau o decizie la o dată ulterioară” din redacţiile televiziunilor şi ziarelor. Lupta pentru supravieţuire se ascute, fiindcă a avea conţinut propriu – sau cel puţin o redactare/împachetare a informaţiei proprie, o interpretare personală – e esenţial pentru ca să te citească cineva. Google News se apropie de o sinteză de informaţie din ce în ce mai relevantă în absolut. Sau pentru tine personal, dacă te gândeşti la modul cum poţi să-ţi customizezi intrarea în pagină.

Sigur că toată povestea va avea în primul pas o influenţă în zona “ştirii externe” de limbă engleză. Însă putem să ne imaginăm ce s-ar întâmpla dacă Google News ar fi interesat de piaţa românească şi ar face câte un parteneriat cu Mediafax, Rompres şi NewsIn. Cred că s-ar mai tăia o halcă zdravănă din publicul presei scrise şi al televiziunilor de ştiri, unde, în multe cazuri, se prosperă mai ales pe spinarea Mediafaxului. Presa românească e al naibii de săracă în informaţii exclusive şi de indolentă (mai ales din motive de manageri, nu de reporteri) atunci când e vorba să sapi mai multe zile după o exclusivitate. Este şi motivul pentru care tabloidele prosperă la noi: Fata de la pagina 5 e totuşi o ofertă diferită faţă de ce-ai văzut aseară la TV, la fel ca ultima cascadorie a lui Cătălin Botezatu.

Eu, dac-aş fi şef de gazetă, mi-aş face o şcoală internă de reporteri de mâine.

Sursa.

P.S.: Oare Google News ştie să elimine şi un “duplicat” de genul aceeaşi informaţie, scrisă cu alte cuvinte? Poate că nu. Dar ce-aţi zice de un mecanism de collective tagging gen “mark as duplicate”?

  1. Moshu49 Reply

    Asta-i buna rau! Ca profan, intreb si eu: la cit sinteti de meseriasi n-ati putea pune si voi de un … google.ro news? De ani buni eu nu mai consum nici hirtie si nici tv (mai putin sportul). Si mai stiu consumatori din astia ca mine. Merci, poate iese!

  2. Adrian B Reply

    Google News are algoritmi care gasesc cuvintele cheie intr-o informatie. De exemplu, daca vede doua articole despre ultima cascadorie a lui Botezatu, probabil ca Botezatu sau numele amicului sau s-ar repeta in anumite locuri in ambele articole (de exemplu, in titlu) si atunci s-ar prinde ca e vorba de acelasi lucru. Deocamdata chestia asta automata pare ca functioneaza (vezi site), si nu cred ca or sa lanseze collective tagging.

  3. Iulian Comanescu Reply

    Adrian: poţi să-mi spui mai mult despre Google şi cuvintele cheie? E o problemă care m-a pasionat, dar recunosc că nu ştiu foarte bine ce face Google în speţă.

  4. bradutz Reply

    ce mai e interesant in treaba asta e ca prin acest parteneriat agentiile par a-si bate cuie in talpa singure — cel putin in cazul unor tari ca romania, unde, in multe cazuri, un abonament la reuters ar fi inlocuit fara scrupule cu practica de a accesa google news. dar agentiile stiu ele ce fac. banu’ gros nu vine din stirile catre media, ci din alte servicii, mai ales financiare (cel putin in cazul reuters, pentru care doar 5-7% din cifra de afaceri e data de relatia cu institutii media). asa ca miscarea google news – agentii reafirma dictonul ‘news is free, context is king’..

  5. Iulian Comanescu Reply

    Bradut: cam asa. Pe de alta parte, imi tot zumzaie prin cap faptul ca CNN a renuntat la Reuters cu cateva zile inainte ca povestea asta cu Google News si agentiile sa iasa la iveala.

    Oricum, in 2007 trebuie sa te gandesti si la alte surse de venit decat ziarele – vezi cifrele tale.

  6. felix Reply

    google a crescut mare, a invatat si acu aplica regula, ca prea era internetu fara reguli, si daca ma gandes google ar putea face curatenie pe internet, sa scoata din cautare site-uri cu mp3, jocuri si pana la xxx, sper sa o faca.

  7. Ionut Oprea Reply

    De fapt, e o lovitura grea pentru site-urile copy-paste, si un pas inainte pentru valoarea adaugata stirilor. Google nu face decat sa aplice niste criterii de baza ale agregarii de informatie la sistemul massmedia.

    Site-urile massmedia importante aveau un procent mic de vizite din Google News. Site-urile care aveau un procent mare, majoritar, al vizitatorilor din GNews fata de cei directi sau din alte surse, cele dependente de el, erau de fapt site-uri care faceau un spam mai de nisa, republicand stirile agentiilor.

    Intr-adevar, sistemul nu e infailibil, mai ales la sistemul “mai pune-o virgula si da-i drumul”, dar cu putina asistenta umana dedicata poate fi imbunatatit.

    Nu cred ca are legatura cu ruperea CNN de Reuters.

  8. Iskander Reply

    incepe rebranduirea bcr…azi, reclama pe toata pagina in cotidianul.

  9. Iulian Comanescu Reply

    Ionuţ: Într-adevăr, şi o parte a site-urilor vor fi afectate, dar şi presa intră-n suferinţă. Mă gândesc că un cititor pasionat de politica din Orientul Apropiat nu se mai hrăneşte de mult cu paginile de externe ale ziarelor româneşti, nu? Tu şi cu mine citim de mult ziarele autohtone pe net ş.a.m.d.

  10. Adrian B Reply

    Pai, despre cuvintele cheie e cam asa:

    In primul rand, exista o lista de “cuvinte de stop”, cuvinte care nu trebuie luate in seama. De exemplu, in romana, pe aceasta lista s-ar afla “pe”, “cu”, “si” etc. In prima faza acestea sunt eliminate din text. Apoi, se verifica frecventa cuvintelor ramase. Cele cu frecventa cea mai mare sunt cele mai relevante. Evident, daca un cuvant apare foarte des in text, si apare si in titlu sau in URL-ul paginii (cum e si la Hotnews, URL-ul include titlul), cuvantul are cu atat mai multe sanse sa fie unul relevant, si va fi tratat special.

    Acest sistem, daca este putin antrenat si ajustat, va recunoaste stiri despre acelasi subiect de pe site-uri diferite, prin faptul ca au aceleasi cuvinte cheie.

  11. Iulian Comanescu Reply

    Adrian: da, ştiu ce zici, asta fac softurile de analiză de conţinut. Reiese că o unitate de content ar putea fi tăguită cu cele mai frecvente cuvinte-cheie. Probabil însă că au mult mai mult 🙂

  12. Adrian B Reply

    Evident ca au mai mult. Si, in plus, chestiile astea incep sa functioneze mai bine cand cantitatea de date analizata este mai mare 😀

  13. Ando Reply

    Buna ziua,

    De fapt ,se stie in ce consta concret acest parteneriat ?
    Oare agentiile respective isi pun chiar toata “productia”
    la dispozitia Google News ?

    Ando

  14. dim Reply

    Intrebare pentru Iulian si Adrian B.: Sa zicem ca Google ar putea, intr-adevar, sa identifice un continut duplicat (de fapt multiplicat in sute-mii de exemplare, cum foarte des se intampla azi pe net), la ce i-ar folosi o asemenea informatie? In mod sigur nu pentru a identifica originea ei de dragul protejarii drepturilor de autor. Nu cred ca va putea gasi vreodata automat sursa initiala si sa faca astfel ordine in varza de content copy-paste care da in clocot pe web. Dimpotriva, cum cei care fura continut stiu sa isi faca “meseria” tot mai profi (ca, de, au vreme, nu trebuie sa alerge 5 zile dupa exclusivitati!), efectul va fi chiar invers: textele copiate, putin umflate, optimizate etc. vor fi mult mai “relevante” pentru Google decat cele ale adevaratilor autori, pe care motoarele de cautare ii vor ejecta din rezultate ca… duplicat sau ii vor tranti pe pagina 1001. Din cate am observat, acest lucru deja se intampla, cu largul concurs oferit de algoritmul Google.

Post your thoughts