Chatovací AI | AI ve vyhledávačích | Wikipedia

Wikipedie je nervózní z AI. Chatboti a to, jak jim věříme, by ji mohli zničit

  • AI teprve začíná, někteří si už ale vystačí jen s chatbotem
  • Odpovědi ChatGPT, Bingu a Barda prostě mnohým stačí
  • To by mohl být ohromný problém zejména pro Wikipedii

Používáte ChatGPT, nový Bing nebo Bard? Jsou návykoví, viďte? Někteří jimi už dokonce nahradili běžné vyhledávače a není týdne, aby nevyšel alespoň jeden článek předpovídající, kdo všechno do konce pětiletky přijde o práci.

Ohrožení nicméně necítí pouze jednotlivé profese, ale i takoví hegemoni jako třeba nadace Wikimedia – provozovatel největší komunitní encyklopedie na světě, která se v průběhu posledních dvou dekád stala v podstatě normou.

Wikimedia na jaře zveřejnila zjednodušenou analýzu hrozeb a příležitostí pro další rozvoj nadace v letech 2023-2024. A vše se točí právě okolo Wikipedie a úsvitu generativních AI, které mohou globální komunitní encyklopedii velmi rychle zničit.

Člověk přestává být autoritou

Autoři zprávy se obávají zejména toho, že s nástupem chytrých chatbotů klesne hlad po člověkem zaštítěných znalostních zdrojích.

Když se zkraje nového milénia objevila na scéně Wikipedie, velmi brzy prakticky zadupala do země všechny tehdejší velké autority. To vše ale při zachování a rozvíjení standardů klasické encyklopedické redakční práce. AI to mění.

29bbf573-fe67-4935-a47b-9c73aff2d1c4
Nejde o to, jestli je toto tvrzení správné, nebo chybné, ale o to, že je poměrně lákavé jej použít i bez další kontroly či zastřešení věrohodnou autoritou

Stručně řečeno, články na Wikipedii dodnes píšou lidé a každý se může podívat, kdo přidal poslední tvrzení k nějakému ožehavému tématu. Běžného smrtelníka to nejspíše vůbec nezajímá – nemá na to čas –, ale pro zkušené wikipedisty je to pobídka k interním akademickým flamewarům, na jejichž konci je ten nejobjektivnější možný článek, který je v silách člověka.

Nová generace znalostních chatbotů nás ale podvědomě učí, že je vlastně jakákoliv lidská redakční činnost zbytná, zastupitelná a nepodstatná.

Wikipedii doposud chránil nedostatek vůle

Z první obavy vzešla i ta druhá. Nejsilnější zbraní Wikipedie proti cíleným nesmyslům v jejích článcích byl doposud prostý nedostatek vůle, píše se v analýze.

Jinými slovy, až na pár excesů je Wikipedie relativně důvěryhodný zdroj informací, protože tvorba článku vyžaduje čas, energii, erudici a především altruistické nadšení. Prostě se do tvorby pouští hlavně ti, pro které je to poslání a chtějí, aby byla Wikipedie kvalitní.

Nástup generativní AI by to mohl velmi rychle změnit, píše se v analýze.

Ability to disrupt our projects requires very little technical know-how – the main protection from this in the past has been lack of will. Historically, disruption has been easy to identify. LLMs might remove the ability to identify large-scale abuse, especially when it’s productionized and automated.

Z hrozeb a příležitostí pro Wikimedii v letech 2023-2024

Zdánlivě věrohodný text na libovolné téma totiž v takovém GPT-4 vytvoří i naprostý pitomec, který se jej pak může pokoušet propašovat do Wikipedie. A právě proto, že bude text znít věrohodně, může se mu to povést, byť by to byl naprostý nesmysl. Wikimedia přiznává, že zatím úplně neví, co s tím.

8a4fe960-ec92-4f2e-a37d-8d59d9c33fec
AI chatbota by mohl někdo použít i v dobré vůli – třeba by chtěl pomoci jazykové mutaci Wikipedie, která trpí nedostatkem autorů. Encyklopedii ale nelze plnit dojmy z generátoru

Ze stejného důvodu odmítají robotické výstupy i některé další znalostní webové služby. Třeba StackOverflow – obří komunitní nápověda pro vývojáře.

Když se v něm už na podzim začala objevovat řešení z ChatGPT, která sice mohla fungovat, ale nebyla nejefektivnější a zastřešená zkušeností nějakého erudovaného experta z branže, provozovatelé řekli dost, byť sami úplně neví, jak něco takového detekovat a reálně zakázat.

Z Wikipedie se stane ground truth

Rizika jsou velká, doba naprosto nepředvídatelná, nicméně tvůrci Wikipedie naštěstí vidí i nějaké to světlo na konci tunelu.

Pokud se z chatovací AI stane norma a standard hledání informací, Wikimedia věří, že by to mohlo paradoxně Wikipedii nakonec zachránit.

What happens when there’s tons of AI-generated content? Could imagine an Internet of trillions of pages of low quality/trustworthiness. When that is the case, both people who create LLMs and readers will need heuristics/hints for where to go to find reliable information – they might go to Wikipedia more. 

Z hrozeb a příležitostí pro Wikimedii v letech 2023-2024

Zní to opravdu jako protimluv, ale nadace se domnívá, že se v takovém případě stane onou pomyslnou ground truth – bazálním a důvěryhodným zdrojem ověřování. Když tedy něco dohledáte v ChatGPT a nebude si jisti pravdivostí, podíváte se právě na Wikipedii, kterou i nadále budou tvořit lidé.

Z Wikipedie se stane učebnice pro AI

S předchozí nadějí nakonec souvisí i ta druhá. Podstatná část obecných znalostí chatovacích robotů plyne právě z toho, že si během učící fáze přečetli Wikipedii. A jelikož nic podobného na světě neexistuje (zvláště z hlediska dostupné licence), budou ji tvůrci AI potřebovat i nadále.

Než se tedy na scéně objeví nové generace umělých inteligencí, které se už budou učit základní pravidla jedna od druhé a bez potřeby primárního zdroje, jejich tvůrci budou potřebovat Wikipedii a bude pro ně naprosto klíčové, aby byla nadále kvalitní a důvěryhodná.

Wikipedie sama a masivně využije možností AI

Byť by se mohlo z výše uvedeného zdát, že je Wikimedia principiálním nepřítelem generativních AI, opak je pravdou. Jde jen o to, jak je použít. Jednou z příležitostí, jak je zakomponovat do encyklopedie, je tak třeba tvorba ilustrační grafiky.

a5240cb9-0b4a-4ede-8350-cc4eb25c1f8b
AI fotografie historických památek asi ne, ale grafy, animace a vysvětlující schémata by umělá inteligence mohla generovat i na Wikipedii

Ta u mnoha článků dodnes chybí, mohla by ji ale dodat právě umělá inteligence na základě textů, které má Wikimedia už dnes k dispozici a ve strukturované podobě.

Dalším možným využitím budou strojové AI překlady z jednoho jazyka do druhého. Velké jazykové modely se učily generovat text napříč jazyky, a tak jej dokážou i překládat.

Organizace v tom vidí ohromnou příležitost a možnost, jak konečně dosáhnout dávných vizí, kdy bude encyklopedie k dispozici ve vysoké kvalitě od angličtiny po esperanto.

Ať už to tedy nakonec dopadne jakkoliv, i tyto rozvahy z ústředí největší encyklopedie současnosti ukazují, že generativní AI změní svět do základů a i v oblastech, kde to zatím ještě není zřejmé. A nejspíše to nebude až někdy v druhé polovině 21. století, jak jsme si mysleli ještě relativně nedávno, ale mnohem dříve. 

Diskuze (34) Další článek: WhatsAppu se nedá věřit, říká Musk. Teď na Twitteru vylepší chat a přidá funkci pro volání

Témata článku: , , , , , , , , , , , ,