Гугл је представио неуронску мрежу Имаген
мисцеланеа / / May 24, 2022
И то ради барем једнако добро као ДАЛЛ-Е 2.
Гоогле најавио Имаген је неуронска мрежа која претвара текстуални упит у слике. То је директан конкурент ДАЛЛ-Е2 из ОпенАИ – који у неким сценаријима функционише још боље.
Да би препознала текстуални упит, неуронска мрежа користи велике језичке моделе - на њима су такође засновани алгоритми за обраду природног говора попут ГПТ-3.
Систем ради у три фазе. Први црта малу слику величине 64 к 64 пиксела, која се прерађује све док неуронска мрежа не може да је промени тако да боље одговара оригиналном захтеву. Слика се затим скалира до 256 к 256 пиксела и Имаген прецизира детаље. У трећој фази, иста ствар се понавља већ са платном коначне величине - 1024 к 1024 пиксела.
У тексту студије се наводи да се Имаген боље носи са разумевањем сложених упита од ДАЛЛ-Е 2. На пример, за упит „Панда прави латте арт“, ДАЛЛ-Е 2 је вратио искључиво латте арт са пандама, док је Гоогле неуронска мрежа успела да произведе углавном тачне резултате:
Али Гугл такође признаје да ниједна од ових неуронских мрежа није могла да одговори на упит „астронаут јахања“: обе су тврдоглаво стављале астронаута на коња, а не обрнуто. И једни и други очигледно имају простора за раст.
Резултати независних процена гледалаца показују да Имаген надмашује ДАЛЛ-Е 2 у погледу тачности и релевантности. И иако се ово поређење може сматрати субјективним, такви резултати су ипак импресивни, с обзиром на то ДАЛЛ-Е 2 је до сада био недостижан идеал којем друге неуронске мреже сличне природе нису могле да парирају. одредиште.
У сваком случају, Имаген за сада остаје експериментални пројекат коме обични корисници не могу приступити. Није јасно колико ће времена проћи пре него што Гугл на основу тога направи услугу отвореног приступа.
Прочитајте такође🧐
- Нова неуронска мрежа Паинт Трансформер претвара фотографију у објекат за сликање
- Полароид будућности: НВИДИА-ина нова неуронска мрежа претвара 2Д слике у 3Д моделе
- Сбер је покренуо неуронску мрежу руДАЛЛ-Е, која генерише слике према опису
Најбоља понуда недеље: попусти из АлиЕкпресс, Ламода, Микит и других продавница