Spravodajský portál Tlačovej agentúry Slovenskej republiky
Nedela 15. jún 2025Meniny má Vít
< sekcia Zahraničie

Vedci v USA 30-násobne zrýchlili generatívnu AI na obrázky

Ilustračná snímka. Foto: Teraz.sk - Elena Halačová

Vedci využili DMD pri spätnej difúzii a všetky kroky, ktoré v rámci nej prebiehali, spojili do jedného, čím sa im podarilo urýchliť vytvorenie obrázku.

Washington 3. apríla (TASR) – Vedci z Massachussettského technologického inštitútu (MIT) prišli na to, ako až 30-násobne zrýchliť generatívne nástroje využívajúce umelú inteligenciu (AI). TASR o tom informuje na základe správy servera Live Science.

Vedci vytvorili techniku označovanú ako destilácia distribučného spájania (distribution matching distillation – DMD), ktorý nástrojmi ako DALL·E 3, Midjourney a Stable Diffusion umožňuje kondenzovať celý proces so 100 krokmi do jediného kroku. Proces sa tak výrazne urýchli bez toho, aby došlo k zníženiu kvality výsledných obrázkov. Vedci podrobný popis svojho postupu uverejnili v decembri v elektronickom archíve preprintov vedeckých prác arXiv.

"Toto zlepšenie nielen výrazne znižuje výpočtový čas, no zároveň zachováva a možno dokonca zvyšuje kvalitu generovaného vizuálneho obsahu,"
uvádza vo vyhlásení jeden z hlavných autorov štúdie Tianwei Yin, ktorý na MIT pôsobí ako doktorand v odbore elektroinžinierstva a informačnej vedy.

Difúzne modely tvoria obrázky postupne viacerými krokmi. AI na tréning využije obrázky s deskriptívnymi popismi a inými metaúdajmi, ktoré jej pomáhajú lepšie pochopiť kontext a význam ukrytý za obrázkami, aby dokázala presne reagovať na zadávané príkazy.

Praktická stránka fungovania týchto modelov vyzerá tak, že vezmú náhodný obrázok a zakódujú ho poľom s náhodným šumom, čím ho zničia, vysvetľuje v príspevku na blogu odborník na fungovanie AI Jay Alammar. Tento proces sa nazýva "progresívna difúzia" a je kľúčovým krokom v procese, ktorým sa AI učí. Následne prebieha až 100 krokov čistenia šumu – tento proces sa označuje ako "spätná difúzia" a vzniká ním obrázok vytvorený na základe textového príkazu.

Vedci využili DMD pri spätnej difúzii a všetky kroky, ktoré v rámci nej prebiehali, spojili do jedného, čím sa im podarilo urýchliť vytvorenie obrázku. Pri jednom z pokusov použili nástroj Stable Diffusion vo verzii 1.5 a dosiahli skrátenie zobrazenia z 2590 milisekúnd (2,59 sekundy) na 90 milisekúnd, teda takmer 30-násobne menej.

DMD tvoria dve zložky, ktoré spoločne znižujú počet iterácií potrebných na vytvorenie použiteľného obrázku. Prvá zložka zvaná "regresná strata" (regression loss) organizuje počas tréningu obrázky na základe podobnosti, čo AI umožňuje rýchlejšie učenie. Druhá zložka sa nazýva strata distribučného priraďovania (distribution matching loss), ktorá zaznamenáva pravdepodobnosť zobrazenia, napríklad nahryznutého jablka, a porovnáva ju s pravdepodobnosťou toho, ako často na takéto jablko možno naraziť v skutočnom svete. Obe zložky spoločne minimalizujú bizarnosť výsledkov, ktoré AI vygeneruje.

"Zníženie počtu iterácií bolo svätým grálom difúznych modelov od ich úplného počiatku. Sme nadšení tým, že sa nám konečne podarila generácia obrázku v jednom kroku, pretože to dramaticky zníži nároky na výpočtový výkon a celý proces sa výrazne urýchli,"
uvádza Fredo Durand, ďalší hlavný autor autor štúdie, ktorý na MIT pôsobí ako profesor v odbore elektroinžinierstva a informačnej vedy.

Nový prístup dramaticky znižuje výpočtový výkon potrebný na generáciu obrázkov, pretože obrázok vznikne už po jednom kroku, nie po stovke krokov postupného vylepšovania ako pri pôvodných modeloch, dodáva Yin. Tento model fungovania dokáže podľa vedcov priniesť výhody v odvetviach ťažiacich z bleskurýchleho a efektívneho vykresľovania, ktoré dokáže výrazne urýchliť tvorbu obsahu.

MURÁROVÁ: Slnečné žiarenie mení bunky kože, môže dôjsť aj k rakovine

V relácii TASR TV Zdravie diskutuje Lucia Illanitzová s dermatologičkou Zuzanou Murárovou.

- Izraelská armáda (IDF) oznámila, že Irán odpálil novú salvu rakiet a vyzvala občanov, aby sa zdržiavali pri leteckých krytoch.

- Slovenský plochodrážnik Martin Vaculík zaznamenal na pretekoch seriálu majstrovstiev sveta Speedway GP v Manchestri najlepší výsledok v sezóne, keď obsadil šieste miesto.

- Slovenskí futbaloví reprezentanti budú chýbať vo štvrťfinále ME hráčov do 21 rokov. Na domácom šampionáte prehrali aj svoj druhý zápas A-skupiny, keď na Štadióne Antona Malatinského v Trnave podľahli rovesníkom z Talianska 0:1.

- Ukrajinský prezident Volodymyr Zelenskyj oznámil, že ukrajinské sily znovu dobyli dedinu Andrijivka v Sumskej oblasti na severovýchode krajiny v rámci snahy vytlačiť z tohto regiónu ruské sily.

- Volejbalistky Slovenska neuspeli v piatom zápase Zlatej Európskej ligy, na turnaji v poľskom Radome prehrali s obhajkyňami celkového triumfu Švédkami 0:3 na sety.

- Turecký prezident Recep Tayyip Erdogan varoval pred ničivou vojnou medzi Izraelom a Iránom, ktorá by mohla vyvolať utečeneckú krízu.

- Futbalisti Španielska zvíťazili na majstrovstvách Európy do 21 rokov v „slovenskej“ A-skupine nad Rumunskom 2:1.

- Británia presúva na Blízky východ ďalšie vojenské prostriedky vrátane bojových lietadiel, aby v prípade potreby poskytovali podporu po celom regióne.

- Víťazom posledného tréningu na Veľkú cenu Kanady, desiateho podujatia seriálu majstrovstiev sveta F1, sa stal časom 1:11,799 minúty Brit Lando Norris na McLarene.

- Slovenský windsurfista Patrik Pollák získal striebro na majstrovstvách sveta v Raceboarde na Veľkej Domaši - Holčíkovce.

- Nové kolo rokovaní Iránu a Spojených štátov o jadrovom programe Teheránu, ktoré sa mali konať v nedeľu, bolo zrušené. Oznámil to ománsky minister zahraničných vecí Badr al-Búsajdí.

- Ruský prezident Vladimir Putin telefonoval s americkým prezidentom Donaldom Trumpom. Obaja lídri hovorili o konflikte medzi Izraelom a Iránom, ako aj o úsilí na urovnanie konfliktu na Ukrajine.

- Bývalý švajčiarsky tenista Roger Federer odmával štartovacou vlajkou začiatok 93. ročníka legendárnych motoristických pretekov 24 hodín Le Mans.

- Izraelský premiér Benjamin Netanjahu vyhlásil, že izraelské útoky na Irán vrátili jeho jadrový program späť, a to možno o celé roky.

- Neznámy útočník skoro ráno strieľal na dvoch vysokopostavených politikov štátu Minnesota, pričom zabil členku štátnej Snemovne reprezentantov a jej manžela a poranil tamojšieho senátora.

- Francúzsko sprísňuje bezpečnostné opatrenia na svojom území vrátane oblastí v okolí židovských a amerických objektov.

- Planetárium Praha sa po dvoch rokoch rekonštrukcií znovu otvorilo pre verejnosť. Výsledkom modernizácie je plne digitálne LED planetárium s najväčšou LED kopulou svojho druhu na svete.

- Pokračovať v iránsko-amerických rozhovoroch by bolo neopodstatnené, pokým Izrael naďalej vykonáva útoky na Irán. Podľa štátnych médií to uviedol iránsky minister zahraničných vecí Abbás Arákčí.

- Slovinský cyklista Tadej Pogačar triumfoval aj v siedmej etape 77. ročníka pretekov Criterium du Dauphine a upevnil si pozíciu na čele celkového poradia.

- Ruský jadrový gigant Rosatom povedie výstavbu prvej atómovej elektrárne v Kazachstane. Astana je pritom najväčším producentom uránu na svete, uviedli úrady v stredoázijskej krajine.