Parteneriatul Google-agenții, o lovitură grea pentru ziare și televiziuni

Am fost mai mult pe drumuri și ieri, și azi și mă mir că nimeni nu a preluat încă știrea referitoare la parteneriatul dintre Google News și agenții de presă ca Associated Press, Agence France-Presse, UK Press Association sau Canadian Press. Parteneriatul mi se pare mult mai important și cu urmări mult mai clare și rapide decât facilitatea care permite actorilor știrii să adauge propriile comentarii, lansată acum câteva săptămâni. Ziarele și televiziunile care toacă aceeași marfă de agenție o s-o pățească și iată de ce:

Asta înseamnă, în principiu, că Google News are acces cu o zi mai devreme decât până acum la știrile din toată lumea, pentru că, fără parteneriatul cu agențiile, acestea erau vizibile mai ales prin intermediul paginilor electronice ale ziarelor, care reproduceau adesea ediția tipărită, iar aceasta prelua “mâine” depeșa de agenție de “azi”. Desigur că multe ziare mari au pe net actualizare în timp real, la fel ca și site-urile de televiziuni sau publicațiile electonice, însă asta nu se întâmpla de fiecare dată.

Pe lângă “viteza de reacție” obținută în acest mod, Google News mai ascund o armă cu potențial letal, în noua lansare: eliminarea “duplicatelor”. Despre ce e vorba: “White House Sex Scandal”, eveniment listat pe prima pagină din Google News, producea, pe stil vechi, 1254 de rezultate “cu duplicate incluse”, cel puțin la ora la care am dat eu search-ul. Fără duplicate, era vorba numai de 474 de rezultate. Cele două linkuri nu par prea diferite, în momentul de față, unui cititor “uman”, însă din punctul de vedere al algoritmilor scăderea de volum, de aproape două treimi, e notabilă; probabil că Google a ajuns la rezultat prin eliminarea unor linkuri la care duc la pasaje de text identice.

Cu alte cuvinte, 60 la sută din ce se scrie în presa mondială – sau “știe” Google că se scrie – e balast, plagiat, copy și paste? Răspunsul e, evident, negativ. În realitate, e vorba de aceleași depeșe ale agențiilor de presă, mai ales de limbă engleză, de pe diferite site-uri de ziare și televiziuni, unde se găsesc ad litteram. Sau cel puțin parțial, dar cu pasajele esențiale comune, fiindcă la agenții se practică scriitura “modulară”, “vagon”, în care poți elimina o parte din știre păstrând primele paragrafe sau schimba lead-ul (începutul), rămânând pe aceeași “bază” de text.

Toată treaba are sens pentru un anume ziar, dintr-o anume arie geografică, aflat într-un anumit context concurențial. Cu alte cuvinte, “Miami Herald” cel de hârtie, din Florida, n-are nici o problemă cu faptul că “The Guardian”, din UK, dă aceeași știre de agenție. Treaba stă însă cu totul altfel pe internet, care se vede de oriunde.

Deocamdată, cum spuneam, pieptănarea asta nu se vede foarte bine cu ochiul liber, dar Google News a făcut, conceptual, un pas mare către “sinteza absolută”. Ceea ce înseamnă și o lovitură grea pentru diverșii tocători de știri externe de genul “un avion a căzut în Pacific” sau “cei doi președinți au stabilit că iau o decizie la o dată ulterioară” din redacțiile televiziunilor și ziarelor. Lupta pentru supraviețuire se ascute, fiindcă a avea conținut propriu – sau cel puțin o redactare/împachetare a informației proprie, o interpretare personală – e esențial pentru ca să te citească cineva. Google News se apropie de o sinteză de informație din ce în ce mai relevantă în absolut. Sau pentru tine personal, dacă te gândești la modul cum poți să-ți customizezi intrarea în pagină.

Sigur că toată povestea va avea în primul pas o influență în zona “știrii externe” de limbă engleză. Însă putem să ne imaginăm ce s-ar întâmpla dacă Google News ar fi interesat de piața românească și ar face câte un parteneriat cu Mediafax, Rompres și NewsIn. Cred că s-ar mai tăia o halcă zdravănă din publicul presei scrise și al televiziunilor de știri, unde, în multe cazuri, se prosperă mai ales pe spinarea Mediafaxului. Presa românească e al naibii de săracă în informații exclusive și de indolentă (mai ales din motive de manageri, nu de reporteri) atunci când e vorba să sapi mai multe zile după o exclusivitate. Este și motivul pentru care tabloidele prosperă la noi: Fata de la pagina 5 e totuși o ofertă diferită față de ce-ai văzut aseară la TV, la fel ca ultima cascadorie a lui Cătălin Botezatu.

Eu, dac-aș fi șef de gazetă, mi-aș face o școală internă de reporteri de mâine.

Sursa.

P.S.: Oare Google News știe să elimine și un “duplicat” de genul aceeași informație, scrisă cu alte cuvinte? Poate că nu. Dar ce-ați zice de un mecanism de collective tagging gen “mark as duplicate”?

15 thoughts on “Parteneriatul Google-agenții, o lovitură grea pentru ziare și televiziuni”

  1. Asta-i buna rau! Ca profan, intreb si eu: la cit sinteti de meseriasi n-ati putea pune si voi de un … google.ro news? De ani buni eu nu mai consum nici hirtie si nici tv (mai putin sportul). Si mai stiu consumatori din astia ca mine. Merci, poate iese!

  2. Google News are algoritmi care gasesc cuvintele cheie intr-o informatie. De exemplu, daca vede doua articole despre ultima cascadorie a lui Botezatu, probabil ca Botezatu sau numele amicului sau s-ar repeta in anumite locuri in ambele articole (de exemplu, in titlu) si atunci s-ar prinde ca e vorba de acelasi lucru. Deocamdata chestia asta automata pare ca functioneaza (vezi site), si nu cred ca or sa lanseze collective tagging.

  3. ce mai e interesant in treaba asta e ca prin acest parteneriat agentiile par a-si bate cuie in talpa singure — cel putin in cazul unor tari ca romania, unde, in multe cazuri, un abonament la reuters ar fi inlocuit fara scrupule cu practica de a accesa google news. dar agentiile stiu ele ce fac. banu’ gros nu vine din stirile catre media, ci din alte servicii, mai ales financiare (cel putin in cazul reuters, pentru care doar 5-7% din cifra de afaceri e data de relatia cu institutii media). asa ca miscarea google news – agentii reafirma dictonul ‘news is free, context is king’..

  4. Bradut: cam asa. Pe de alta parte, imi tot zumzaie prin cap faptul ca CNN a renuntat la Reuters cu cateva zile inainte ca povestea asta cu Google News si agentiile sa iasa la iveala.

    Oricum, in 2007 trebuie sa te gandesti si la alte surse de venit decat ziarele – vezi cifrele tale.

  5. google a crescut mare, a invatat si acu aplica regula, ca prea era internetu fara reguli, si daca ma gandes google ar putea face curatenie pe internet, sa scoata din cautare site-uri cu mp3, jocuri si pana la xxx, sper sa o faca.

  6. De fapt, e o lovitura grea pentru site-urile copy-paste, si un pas inainte pentru valoarea adaugata stirilor. Google nu face decat sa aplice niste criterii de baza ale agregarii de informatie la sistemul massmedia.

    Site-urile massmedia importante aveau un procent mic de vizite din Google News. Site-urile care aveau un procent mare, majoritar, al vizitatorilor din GNews fata de cei directi sau din alte surse, cele dependente de el, erau de fapt site-uri care faceau un spam mai de nisa, republicand stirile agentiilor.

    Intr-adevar, sistemul nu e infailibil, mai ales la sistemul “mai pune-o virgula si da-i drumul”, dar cu putina asistenta umana dedicata poate fi imbunatatit.

    Nu cred ca are legatura cu ruperea CNN de Reuters.

  7. Ionuț: Într-adevăr, și o parte a site-urilor vor fi afectate, dar și presa intră-n suferință. Mă gândesc că un cititor pasionat de politica din Orientul Apropiat nu se mai hrănește de mult cu paginile de externe ale ziarelor românești, nu? Tu și cu mine citim de mult ziarele autohtone pe net ș.a.m.d.

  8. Pai, despre cuvintele cheie e cam asa:

    In primul rand, exista o lista de “cuvinte de stop”, cuvinte care nu trebuie luate in seama. De exemplu, in romana, pe aceasta lista s-ar afla “pe”, “cu”, “si” etc. In prima faza acestea sunt eliminate din text. Apoi, se verifica frecventa cuvintelor ramase. Cele cu frecventa cea mai mare sunt cele mai relevante. Evident, daca un cuvant apare foarte des in text, si apare si in titlu sau in URL-ul paginii (cum e si la Hotnews, URL-ul include titlul), cuvantul are cu atat mai multe sanse sa fie unul relevant, si va fi tratat special.

    Acest sistem, daca este putin antrenat si ajustat, va recunoaste stiri despre acelasi subiect de pe site-uri diferite, prin faptul ca au aceleasi cuvinte cheie.

  9. Adrian: da, știu ce zici, asta fac softurile de analiză de conținut. Reiese că o unitate de content ar putea fi tăguită cu cele mai frecvente cuvinte-cheie. Probabil însă că au mult mai mult 🙂

  10. Buna ziua,

    De fapt ,se stie in ce consta concret acest parteneriat ?
    Oare agentiile respective isi pun chiar toata “productia”
    la dispozitia Google News ?

    Ando

  11. Intrebare pentru Iulian si Adrian B.: Sa zicem ca Google ar putea, intr-adevar, sa identifice un continut duplicat (de fapt multiplicat in sute-mii de exemplare, cum foarte des se intampla azi pe net), la ce i-ar folosi o asemenea informatie? In mod sigur nu pentru a identifica originea ei de dragul protejarii drepturilor de autor. Nu cred ca va putea gasi vreodata automat sursa initiala si sa faca astfel ordine in varza de content copy-paste care da in clocot pe web. Dimpotriva, cum cei care fura continut stiu sa isi faca “meseria” tot mai profi (ca, de, au vreme, nu trebuie sa alerge 5 zile dupa exclusivitati!), efectul va fi chiar invers: textele copiate, putin umflate, optimizate etc. vor fi mult mai “relevante” pentru Google decat cele ale adevaratilor autori, pe care motoarele de cautare ii vor ejecta din rezultate ca… duplicat sau ii vor tranti pe pagina 1001. Din cate am observat, acest lucru deja se intampla, cu largul concurs oferit de algoritmul Google.

Leave a Reply

Your email address will not be published. Required fields are marked *