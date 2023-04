Hoe wij omgaan met informatie op het internet is helemaal aan het veranderen. En onze job ziet er straks ook heel anders uit. In deze blog volgen we de pijlsnelle opmars­ van ChatGPT en generatieve AI.

21 april 2023

Nieuwe trend: betalen om AI te mogen trainen

De grote taalmodellen zoals GPT-4 hebben massa’s data nodig om te worden getraind. Websites als Reddit, Twitter en Stack Overflow, ruiken geld. Ook nieuwsuitgevers hopen op een vergoeding.

Elon Musk is het beu dat OpenAI en Microsoft hun AI-systemen voederen met tweets. ‘Ze hebben illegaal getraind op data van Twitter’, tweette Musk woensdag over Microsoft. ‘Tijd voor een rechtzaak’. In december tweette de miljardair dat hij de toegang van OpenAI tot de Twitter database geblokkeerd had.

Ook bij Reddit vinden ze het intussen welletjes: wie zijn AI-systeem vlot wil leren chatten door het te trainen op de vele forums van Reddit, die zal moeten betalen. Het tarief is nog niet bekendgemaakt. Stack Overflow, een website met 50 miljoen vragen en antwoorden over programmeren, volgt dat voorbeeld.

Nieuwsmedia zijn zich ook aan het afvragen hoe ze kunnen verhinderen dat AI-systemen als Bing en Bard informatie uit hun artikels halen en herformuleren - of hoe ze daar wat aan kunnen verdienen. ‘Ontwikkelaars van generatieve AI moeten onderhandelen met uitgevers over het recht om hun inhoud te gebruiken’, schrijft de Amerikaanse belangengroep News/Media Alliance (NMA). De technologiebedrijven moeten eerst toestemming krijgen alvorens ze hun AI-systemen kunnen trainen op artikels van de nieuwsmedia, vindt de NMA. Ook voor het aanbieden van antwoorden die gebaseerd zijn op die artikels of die deze artikels samenvatten, moet toestemming worden gevraagd - en de uitgevers maken duidelijk dat ze daar een vergoeding voor verwachten.

The Washington Post onderzocht deze week welke websites worden gebruikt om AI-systemen te trainen. De krant analyseerde het C4 dataset, een enorme verzameling data afkomstig van 15 miljoen websites die vergaard is door Google en die gebruikt is om AI-systemen als T5 van Google en LLaMA van Meta te trainen (of GPT-4 ook gebruik heeft gemaakt van C4 is niet bekend). Wat blijkt? Uiteraard zit de C4 database tjokvol teksten van Wikipedia. Maar bijvoorbeeld ook een gigantische hoeveelheid beschrijvingen van patenten afkomstig van patents. google.com en eindeloze discussies over de game World of Warcraft van de fansite wowhead.com. The Washington Post noteert ook dat in de C4 dataset heel wat materiaal zit afkomstig van piraatwebsites, waaronder illegale e-boeken van het inmiddels opgedoekte b-ok.org.

21 april 2023

ChatGPT wordt nu ook sociaal (en speelt Sims)

ChatGPT had tot nog toe altijd een vraag nodig om los te barsten. Iemand van vlees en bloed opent de dialoog met de computer en dan ontstaat er een ‘gesprek’. Maar ChatGPT kan meer. Wat gebeurt er als je een computerspel zoals de Sims combineert met ChatGPT, dan gaan de figuurtjes vrijuit reageren op elkaar. Ze beginnen, zonder dat wij het vragen, met mekaar te babbelen over waar ze naartoe gaan, wat hun plannen zijn… Het lijken echte sociale wezentjes.

Daarover (én over de regulering van ChatGPT) hebben we het in onze podcast Bits&Atomen.

AI maakt ‘nieuwe’ Oasis-plaat

Fake Oasis, fake Drake en fake The Weeknd, allemaal gemaakt door of toch met artificiële intelligentie. Het internet kan er niet over zwijgen deze week. Wat is er aan de hand?

Nick De Leu zet op een rijtje wat we weten en wat we niet weten over de ‘lost tapes’ van Oasis en over het nummer Heart on my sleeve, met de (via AI gerecreëerde) stemmen van Drake en The Weeknd.

• Lees het artikel: Britse band maakt ‘nieuwe Oasisplaat’ met behulp van AI - maar mag dat wel?

18 april 2023

AI-beeld wint fotografieprijs

Fotograaf en AI-kunstenaar Boris Eldagsen heeft de Sony World Photography Award geweigerd. En wel omdat aan zijn winnende ‘foto’ geen fototoestel te pas is gekomen. Met zijn stunt hoopte Eldagsen een discussie los te maken over AI en fotografie.

Pseudomnesia: the electrician is door de inrichters van de wedstrijd, de World Photography Organisation, onderscheiden in de categorie ‘creative’, wat betekent dat zo goed als alle technieken zijn toegelaten. Eldagsen had er dan ook geen geheim van gemaakt dat hij zijn beeld had gecreëerd met behulp van een beeldgenerator en de organisatie had daar geen probleem mee.

Maar Eldagsen heeft er wél een probleem mee dat een artificieel beeld zomaar een fotografieprijs kan wegkapen. ‘AI-beelden en fotografie horen niet met elkaar te concurreren in een wedstrijd als deze’, schrijft hij op zijn website. Hij vindt het hoog tijd voor een diepgaande discussie over ‘wat we beschouwen als fotografie en wat niet’. Naar zijn gevoel probeert de World Photography Organisation die discussie uit de weg te gaan.

Deze twee mensen hebben nooit bestaan en aan dit beeld is geen camera of lens te pas gekomen. Let op de vervormingen van de vingers, een veelvoorkomend fenomeen bij beeldgeneratoren. Foto: Boris Eldagsen

Eldagsen, een ervaren fotograaf, is overigens best wel trots op zijn huidige visuele werk met AI, ook al dringt hij aan om het vooral geen fotografie te noemen. Het winnende beeld is het resultaat van ‘een complexe interactie van prompt engineering, inpainting en outpainting waarbij ik gebruikmaakte van mijn kennis over fotografie’, schrijft hij met onmiskenbare fierheid. Pseudomnesia: the electrician kwam dus niet zomaar uit de computer gerold, maar werd beetje bij beetje bijgewerkt en verbeterd. Eldagsen maakte daarbij gebruik van de Dall-E 2-beeldgenerator van OpenAI.

Vorige zomer won een Amerikaanse gameontwerper een lokale kunstwedstrijd in Colorado met een beeld dat was gemaakt met de generator Midjourney.

17 april 2023

Elon Musk start nieuw AI-bedrijf om OpenAI te beconcurreren

Miljardair Elon Musk heeft een nieuw bedrijf opgericht onder de naam X.AI. Daarmee zou hij de concurrentie willen aangaan met OpenAI, de maker van ChatGPT en Dall-E.

Musk was in 2015 zelf één van de oprichters van OpenAI. Maar hij verbrak in 2018 de banden met de organisatie na een machtsstrijd met een andere mede-oprichter, Sam Altman, die inmiddels ceo werd. Vooral sinds de succesvolle lancering van ChatGPT door OpenAI, in november 2022, heeft Musk zich herhaaldelijk erg kritisch uitgelaten over de huidige koers van het bedrijf.

Foto: REUTERS

Musk is scherp over de nauwe banden met Microsoft die OpenAI er nu op na houdt en over de manier waarop het bedrijf zijn technologie grotendeels geheim houdt. Maar Musk klaagt ook dat ChatGPT te ‘woke’ zou zijn, door bewuste ingrepen van OpenAI. ‘Het gevaar dat AI wordt getraind om woke te zijn – in andere woorden om te liegen – is dodelijk’, tweette hij bijvoorbeeld in december.

In maart verklaarde Elon Musk zich nog voorstander van een pauze van zes maanden in het ontwikkelen van geavanceerde AI-systemen. Hij was een van de eerste ondertekenaars van een open brief waarin tot zo’n moratorium werd opgeroepen. Maar haast tegelijkertijd was hij blijkbaar zelf een bedrijf aan het oprichten om aan zo’n AI-systemen te gaan werken.

Onlangs raakte bekend dat Musk de naam van het bedrijf achter Twitter heeft omgedoopt van Twitter Inc. tot X Corp. Hij heeft eerder gesuggereerd dat hij Twitter wil laten opgaan in een ‘super app’ die X zou heten. De bedrijfsnaam X.AI suggereert een verband met die plannen. De website Business Insider bericht dat Musk duizenden GPU’s – de processoren die worden gebruikt om AI-modellen te trainen –heeft aangekocht.

4 april 2023

Stanford rapport: academische wereld steeds meer aan zijlijn in AI

Tot 2014 waren de meeste machine learning modellen afkomstig uit de academische wereld. Maar sinds dat jaar ligt het zwaartepunt in de AI-ontwikkeling bij de technologiebedrijven. Die trend is in 2022 alleen maar verder verstekt, blijkt uit het jaarlijkse ‘AI Index’ rapport van de universiteit van Standford.

Foto: Getty Images/iStockphoto

Stanford maakt ieder jaar de balans op van de AI-ontwikkeling. Het is vooral een bundeling van bestaande studies en statistieken, die ze dit jaar samenvatten in tien trends. De eerste daarvan is de groeiende dominantie van de tech-bedrijven. Van de belangrijke nieuwe machine learning modellen (een bredere term die ook de grote taalmodellen à la GPT omvat) waren er in 2022 maar drie afkomstig uit de academische wereld, in 2020 waren dat er nog tien. 32 modellen kwamen van tech-bedrijven.

Foto: Stanford

En dat heeft uiteraard veel, zo niet alles te maken met een andere trend: de stijgende kostprijs om de grootste modellen te trainen. Het uit 2019 daterende GPT-2 kostte naar schatting 60.000 dollar om te trainen. Bij het in 2022 gelanceerde PaLM van Google, was dat 8 miljoen dollar of 160 keer meer.

Foto: Stanford

Nog een vaststelling uit het rapport: jazeker, de AI is nog altijd een mannenwereld. 79% van alle nieuwe doctoraten in de AI, gaat naar een man.

Een andere interessante reeks cijfers gaat over attitudes tegenover AI in heel de wereld. Die komen uit een studie van Ipsos. De studie vraagt of mensen het eens zijn met de stelling ‘Producten en diensten op basis van AI hebben meer voordelen dan nadelen’. In China is 78% van de bevolking die mening toegedaan, of dat vertellen ze toch aan de onderzoekers van IPSOS. Het kan iets te maken hebben met de politiek van de Chinese overheid.

Maar overal elders in de wereld is de bevolking meer sceptisch. En het meest van al in Europa. In Frankrijk gelooft maar 31% van de ondervraagden dat AI netto positief uitvalt, de laagste score, België scoort met 38% net iets hoger. Wie er gelijk heeft, de Chinezen of de Fransen, is natuurlijk een heel andere vraag. Hoe dan ook, die attitudes hangen samen met economische en politieke factoren (welke daarvan oorzaak zijn en welke gevolg, daar mag u eens zelf over piekeren). Niet voor niets stellen we vast dat Europa amper beschikt over eigen grote AI-bedrijven, maar wél wereldwijd het voortouw neemt in het reguleren van deze technologie.

Foto: Stanford

