Bandaríska tæknifyrirtækið OpenAI gaf nýlega út uppfærslu á gervigreindarlíkaninu GPT þar sem fram kom að íslenska var valin fyrst tungumála, utan ensku, í þróunarfasa þess. Í frétt Stjórnarráðsins um málið kemur fram að 40 sjálfboðaliðar hafi unnið að því síðustu vikur, á vegum máltæknifyrirtækisins Miðeindar í samstarfi við OpenAI, að þjálfa nýjustu útgáfuna, GPT-4, í því að svara betur á íslensku.
Við hjá Creditinfo erum stolt að segja frá því að gögn úr Fjölmiðlavakt Creditinfo voru nýtt við að þjálfa líkan OpenAI í íslensku í gegnum svokallaða Risamálheild Árnastofnunar. Í nýjustu útgáfu Risamálheildarinnar eru rúmlega 2,4 milljarðar orða, en textarnir eru að langstærstum hluta fréttatextar, textar af samfélagsmiðlum og opinberum textum. Creditinfo hefur um árabil veitt texta úr útvarpi, sjónvarpi, dagblöðum og netmiðlum úr Fjölmiðlavakt Creditinfo í Risamálheildina.
Í fréttasafni Fjölmiðlavaktarinnar eru aðgengilegar fréttir úr dagblöðum, sjónvarpi og útvarpi frá 1.mars 2005. Einnig eru aðgengilegar fréttir allra stærstu netmiðla landsins frá 1. janúar 2010.