Как мультимодальные модели учатся понимать текст, картинки, видео и аудио — Андрей Кузнецов

1 view
Skip to first unread message

Anton Kolonin @ Gmail

unread,
Sep 11, 2023, 10:06:00 AM9/11/23
to AGI in Russian
https://aigents.timepad.ru/event/1412596/
Как мультимодальные модели учатся понимать текст, картинки, видео и
аудио — Андрей Кузнецов (исполнительный директор по исследованию данных
Sber AI)
14 сентября 2023, 18:00 (время московское)
От спикера: С 2010 года занимаюсь исследованиями в области компьютерного
зрения, в 2013 г. защитил диссертацию на соискание учёной степени
к.т.н., за спиной большое количество научных исследований, работ и более
60 публикаций в журналах и тезисах международных конференций уровней
Q2/Q1 и A/A*, индексируемых базами данных Scopus и Web of Science
(H-Index = 11). В 2021 году руководил командой Самарского университета в
коллаборации с командами Sber AI, SberDevices и AIRI в рамках проекта
ruDALL-E. Последние два года руковожу исследованиями в Sber AI и AIRI,
где мы разрабатываем такие модели как генеративная модель синтеза
изображений и видео по тексту Kandinsky, мультимодальная многозадачная
модель RUDOLPH, модель переноса лица с одного фото на фото или видео
GHOST и другие решения в области CV, NLP и мультимодальных архитектур.
- https://scholar.google.com/citations?user=q0lIfCEAAAAJ
- https://orcid.org/0000-0001-6446-8663
- https://t.me/complete_ai


--
-Anton Kolonin
telegram/skype/facebook: akolonin
mobile/WhatsApp: +79139250058
akol...@aigents.com
https://aigents.com
https://dzen.ru/aigents
https://www.youtube.com/aigents
https://www.facebook.com/aigents
https://wt.social/wt/aigents
https://medium.com/@aigents
https://steemit.com/@aigents
https://reddit.com/r/aigents
https://twitter.com/aigents
https://golos.in/@aigents
https://vk.com/aigents
https://aigents.com/en/slack.html
https://www.messenger.com/t/aigents
https://web.telegram.org/#/im?p=@AigentsBot
Reply all
Reply to author
Forward
0 new messages