Интервью с техническим директором “РЕН ТВ” Денисом Максимовым.
– Как Вы оцениваете прошедшее десятилетие?
– Колоссальный скачок, приведший ко всем изменениям, начался намного раньше.
Я помню, как в начале 90-х, во время учебы в институте МИРЭА, спорил с аспирантом кафедры «Проблем управления», утверждавшим: “Очень скоро мы будем слушать цифровой звук, и вообще, аналоговые схемы будут заменены цифровыми”. Это было время разгар эпохи аудиокассет, катушки отжили свое, оставшись у профессионалов и фанатов, винил сдает позиции, компакт диски только-только пошли в широкие массы. Я уже изучил теорему Котельникова и понимал, что в принципе любой звуковой сигнал можно оцифровать, а затем восстановить без потерь, но на практике любое аналого-цифровое преобразование неминуемо приводит к искажениям, а при сжатии – к катастрофическим, и активно возражал: “Как можно сравнивать качественный аналоговый звук с мертвым цифровым, аналоговые схемы с их быстродействием и цифровые схемы. Каких размеров нужно оборудование для обработки сигналов!?” Тогда представить было невозможно, что аналоговые технологии окажутся вытесненными по всем фронтам абсолютно. А я в кармане буду носить компьютер с 8-ядерным процессором, частотой под два гигагерца и 128 Гб накопителя, да еще и подключенный к глобальной информационной сети.
В институте я программировал и понимаю, что такое хорошо “вылизанный” код, который оптимизирован и минимизирован, поскольку и ресурс процессора скромный, и памяти не хватает. Сегодня программирование фактически свелось к объединению готовых блоков, построению связей между ними и рисованию интерфейса. Повсеместно монструозные программы. Для мобильного телефона софт занимает 200-300 мегабайт. Притом не софт, где половину или 2/3 занимает растровая графика, а софт прикладной. У меня в телефоне есть программный продукт для умного дома с инсталляционным пакетом порядка 100 Мб. Картинки – пиктограммы, минимум анимации, достаточно простой интерфейс. В телефоне софт занимает более 200 Мб – это его потроха: код из чужих модулей и пользовательский интерфейс. Про оптимизацию создатели не слышали. Зачем, если можно сделать быстро и использовать мощные ресурсы.
В конце 90-х для обработки видео требовались специализированные решения, платы ввода-вывода, аппаратные процессоры обработки эффектов, аппаратные кодеки. Сегодня на обычном бытовом компьютере просто софтом можно делать намного больше, да что на компьютере – на мобильном телефоне!
Тенденция активного ухода в софт наблюдается последние лет 10 лет. В цифру же ушли раньше. Все идут по пути унификации платформы и развития именно программного решения.
Одновременно очень сильно изменился телевизионный контент. Раньше сюжеты в новостях снимались с хороших наплечных камер, со штативом чаще всего, с хорошей дорогой оптикой. Сейчас зрителю не важно качество, важно получить информацию как можно быстрее. Мгновенно с места отдать сигнал намного ценнее хорошей картинки. Пусть это мобильный телефон, картинка трясется, но она снимается непосредственно в момент события – это интересно зрителю. Если удается совместить оперативность и качество – вообще прекрасно.
Конъюнктура текущего периода – уход из телевидения с новостями в цифровой мир. Новым поколениям потребителей быстрее и комфортнее получать новости из интернет-среды.
– Что Вы думаете не об автоматизации, а об искусственном интеллекте, его роли в медиа в обозримом будущем?
Странное название «искусственный интеллект», на мой взгляд, не соответствующее действительности. Это не интеллект, это – набор алгоритмов. Алгоритм не может обладать интеллектом, потому что интеллектом обладает создатель этого алгоритма. Искусственный интеллект в настоящий момент является, и в ближайшем будущем будет являться, всего лишь набором правил и логики по их исполнению, возможно, с использованием датчиков псевдослучайных чисел.
– Но у Вас уже сейчас в кармане смартфон – представитель искусственного интеллекта.
– На данном этапе развития искусственный интеллект, – не интеллект вовсе. Говорить о том, что искусственный интеллект – это что-то похожее, сравнимое с интеллектом человека, с точки зрения допущения, что человеческий разум – это программа, наверное, можно. Я видел созданные искусственным интеллектом картины и видеоклипы. Но все равно человек написал этот алгоритм, согласно которому искусственный интеллект, оперируя датчиками случайных чисел, выбирая какие-то дополнительные условия, создает эти «шедевры». Видимо, через определенное количество лет, когда быстродействие компьютеров увеличится еще больше, мы не сможем отличать, допустим, говорит с нами человек или компьютер. Те же голосовые технологии очень здорово шагнули вперед. Но сможет ли программа действительно создавать?
– А в этой индустрии?
– Если говорить именно о применимости к телевидению или к медиа искусственного интеллекта, то возможности огромные. Начиная от пользовательских интерфейсов, через которые человек воспринимает информацию. К примеру, на портале IZ мы внедрили голосовой сервис для чтения статей. И скажу Вам, очень неплохо читались новости, с выражением, с пунктуацией. Еще каких-нибудь десять лет назад такое было невозможно даже представить из-за примитивности голосовых технологий, нехватки мощностей и ширины каналов связи.
Применительно к новостям искусственный интеллект очень поможет в разборе исходных материалов. Съемку надо расшифровать, распознать изображения ключевых кадров, чтобы после внесения материала в систему медиа-хранения и управления медиа-активами автоматически получить все хештеги и дополнительную информацию. Причем мы уже интересуемся такими системами. Но пока они либо очень примитивные, либо необоснованно дорогие, либо могут работать только во внешнем облаке.
На данный момент есть много архивного видео и фотографий, а вручную описать эти объемы – колоссальный труд. И здесь как раз искусственный интеллект помог бы.
– С видео еще сложнее.
– И для видеоархивов, и для фотоархивов, и даже для текстовых архивов искусственный интеллект очень сильно помог бы протегировать правильно. Но к сожалению, искусственный интеллект пока распознает только человека, о котором что-то «знает» или уже «видел» его фотографии. В остальных случаях вердикт: «мальчик», «девочка», «мужчина», «женщина». Однако еще совсем недавно было еще хуже. Вигвам у искусственного интеллекта оказывался вулканом. Потому что на фото у вигвама темные и светлые участки, дымок поднимается и благодаря этому очень похож на гору со снежной шапочкой и дымящимся вулканом.
Для реального прорыва в области искусственного интеллекта, наверно нужно глубже изучить человека, методы, использующиеся в нашей «программе». Но подход к алгоритмизации искусственного интеллекта может быть и не такой, как у человека. Возможно, у человека это все настолько по-другому устроено, что мы на текущем этапе развития и не сможем понять, как. Создатель «программы» человека определенно был грамотным специалистом и хорошо оптимизировал алгоритмы.