Эксклюзивное интервью Филиппа Петипона (Philippe Petitpont), директора и сооснователя Moments Lab, на IBC2024.
— Какие новые продукты ваша компания представляет на IBC2024?
Как известно, основная проблема при создании контента — это время, которое требуется для формирования видео. Нужно потратить пять минут только на то, чтобы найти один кадр для рассказа истории. Если это десятиминутная видеоистория, в ней может быть более 600 кадров, из-за чего её создание становится очень долгим и сложным процессом. Мы разработали искусственный интеллект, который может понимать видео, делать его доступным для поиска, и теперь вместо того, чтобы тратить по пять минут на каждый кадр, тратится всего две секунды.
Наш ИИ называется MXT-1.5. Это то, что мы называем мультимодальным ИИ. Мультимодальный ИИ означает, что мы анализируем всё происходящее в видео и аудио, используя более 20 различных моделей искусственного интеллекта. Мы объединяем всё это вместе, чтобы убедиться, что можем понимать видео лучше и быстрее людей, причём гораздо более масштабируемым способом. Самое замечательное, что наш ИИ учится каждый день. Он обучается на данных клиентов и продолжает ежедневно учиться, чтобы описывать мир лучше людей.
Недавнее сравнение мультимодального искусственного интеллекта MXT-1.5 с основными моделями, такими как GPT-4o, Google Gemini 1.5 Pro и Nvidia VILA 1.5 на наборе данных VideoMME, показало её превосходство над ними.
-
Модель MXT-1.5 обладает трёхступенчатой иерархической индексацией для точного анализа видео
-
Она объединяет генеративные и экспертные системы искусственного интеллекта
-
Кроме того, ИИ обучен для конкретных отраслей — телевидения и спорта.
Важной особенностью этого мультимодального искусственного интеллекта является его высокая технологичность. Многие компании, работающие в сфере технологий, считают, что мы опережаем рынок примерно на два года. Наш ИИ может анализировать 500 часов видео в минуту и при этом в семь раз более экономичен по сравнению с другими моделями искусственного интеллекта. Цель состоит в том, чтобы обеспечить готовность этого ИИ к работе с бизнес-подразделениями, помогая им предоставлять аналитические данные и экономически эффективные решения — независимо от того, имеют ли они дело с 1000 или миллионами часов видео.
Когда вы можете описать огромное количество видео в большом масштабе, это открывает новые способы работы. Это позволяет вам быстро находить видео и быстрее монтировать черновые варианты. Вместо того чтобы работать с каждым кадром по отдельности, вы можете определить 50 кадров, которые необходимы для создания видео. Поиск кадров один за другим уходит в прошлое, и теперь мы движемся к тому, чтобы собирать 10 или даже 50 кадров одновременно, чтобы рассказать историю. Мы верим, что будущее видеомонтажа — за системой подсказок, которая сделает процесс быстрым и доступным для большего числа людей. Не нужно будет обладать навыками видеоредактора, что поспособствует созданию видеоисторий в больших масштабах.
Что касается восприятия контента зрителями, они хотят более индивидуального подхода. Люди хотят видеть только то, что им интересно. Зная в точности содержание контента, можно настроить восприятие под зрителя. Например, если кто-то увлечён историей Второй мировой войны, он может взаимодействовать с интерфейсом, чтобы найти или получить рекомендации по контенту на эту тему. Потенциал для рекомендаций по контенту и таргетирования рекламы огромен.
По мере того как мы переходим в мир без файлов cookie, таргетинг становится сложнее, если вы не знаете зрителя. Вот где понимание контента становится критически важным. Например, если в кулинарном шоу есть реклама бренда сэндвичей, мы можем убедиться, что эта реклама появляется, когда контент соответствует ей, например, во время сцены о еде. Такое понимание видео обеспечит лучший опыт для зрителей и предложит больше вовлечённости, большую аудиторию и более целенаправленную рекламу, особенно в тех областях, которые сегодня плохо поддаются таргетированию.
Эксклюзивный обзор ключевых событий IBC2024 – опрос участников и гостей о тенденциях и новинках International Broadcasting Convention!