С тех пор, как мобильные телефоны начали вытеснять коммуникационные устройства под названием «смартфон», стало понятно, что производителям мало функции звонка, и они решили не просто расширить коммуникационные возможности, а и создать действительно умные гаджеты. Но первые смартфоны пусть и выделялись крутыми на свое время камерами, а также позволяли пользоваться почтой, все равно не могли того, что делают современные устройства. Все чаще в битвах мегапикселей и гигабайтах ОЗУ на первый план выходят функции ИИ. Нейромодуль, камера с искусственным интеллектом, алгоритмы – эти слова буквально наводнили современный маркетинг, который то и дело стремиться проникнуть в несведущие умы потенциальных покупателей. И все же главные особенности ИИ в обзорах упоминаются вскользь, так что попробуем разобраться в этом подробнее.
Немного истории гаджетов с интеллектом
Попытки возложить на вычислительные устройства решение сложных задач возникли давно. Но искусственный интеллект уже не просто программа. И хотя речь больше о машинном обучении, чем об аналоге человеческого мышления, подчас нынешний ИИ может решать куда более сложные задачи, чем человек, причем за считанные мгновения. Таким образом, современные гаджеты, где уже работает ИИ, выполняют свои функции уже не по программе, а по определенным алгоритмам, один из которых известен как «нейросети».
Конечно, умные алгоритмы уже давно используют во внешней среде, но «заселив» искусственный интеллект в сам смартфон, можно решать некоторые задачи «по месту», не прибегая к удаленным сервисам и не затрачивая трафик. Тем более что мощности мобильных чипов позволяют. Более того, производители уже выделили для этого функционала отдельный блок – нейропроцессор, или NPU, который ускоряет алгоритм обучения и уменьшает энергопотребление. Первым процессором с отдельным NPU стал Кирин 970, от компании Хуавей. Именно она впервые представила устройства на его основе и заявила о том, что будет делать упор на развитие ИИ в своих последующих гаджетах. Попробуем сравнить смартфоны первого и актуального поколения от компании Хуавей, где применен NPU:
Модель | Размер дисплея | Платформа | Камера | Батарея |
---|---|---|---|---|
Huawei P20 | 5.8, 1080х2240 | Кирин 970+6Гб ОЗУ | Дуал, 12+20Мп | 3400мач |
Huawei P30 | 6.1, 1080х2340 | Кирин 980+8Гб | Трипл, 40+16+8Мп | 3650мач |
Как видно, улучшаются возможности технической составляющей, но как бы хорошо не снимали камеры, ключевая работа ведется именно на уровне ИИ. Помимо наращивания мощностей нейропроцессоров, компания старается возложить на них все больше задач.
Как машинное обучение помогает в распознавании лиц
Разблокировка лицом – не новая функция, которая поддерживается даже в бюджетных моделях. Но если они распознают двухмерный рисунок по простым алгоритмам сравнения, продвинутый флагман делает это совершеннее. Дело в том, что простые устройства не способны справляться с задачей в темноте и их нередко можно обмануть фотографией или даже лицом похожего человека. В продвинутом варианте будет распознаваться трехмерная модель лица, а количество точек распознавания уже превышает 30 тысяч. Но и здесь не обойтись без проблем в виде макияжа или бороды владельца: задача ИИ выявить подобные изменения и узнать владельца.
Сортировка фотографий по разным папкам
Распознавание широко применяется не только в разблокировке: в настоящее время ИИ может определять предметы и узнавать людей, как в камерах, так и на картинках в памяти устройства. При желании пользователь может запросить отобрать все фотографии с автомобилями, отдельными лицами, едой или какими-либо предметами по разным папкам, после чего ИИ распознает заданные изображения и отсортирует их по разным папкам.
Как нейросети улучшают автономность
Об этом тоже часто говорят производители флагманов на презентациях. На самом деле ИИ всего лишь пытается изучить наши привычки для контроля тех или иных приложений. К примеру, если владелец смартфона ночью спит, большая часть программ явно не понадобится, и алгоритм их отключает, а перед пробуждением он подгружает то, что будет использовано в первую очередь. Второй упор сделан на прогнозировании нагрузки: к примеру, учитывается частота смены кадров в играх и больше всего ресурсов тратится в сложных динамических сценах, в то время как без нагрузки устройство не потребляет максимальное количество энергии.
Как оптимизируется производительность
Раньше во флагманских устройствах преподносилась мощность процессора. Теперь же помимо обработки тяжелых игр гаджет должен не затрачивать «силы» на слабых задачах вроде чтения книги. Для лучшей оптимизации есть тяжелые ядра для игр, средние для приложений вроде Facebook и экономичные. Задача ИИ задействовать оптимальные, в зависимости от сценария использования.
Обработка звука
Часто во время разговора по телефону мешают посторонние шумы вроде автомобилей или ветра: задача ИИ отделить полезный звук от мешающего.
Переводы
Упразднится ли профессия переводчика в ближайшем будущем пока неизвестно, но для этого есть все предпосылки. Теперь на смартфонах доступны оффлайн-переводчики, эффективность которых постоянно растет, как и скорость обработки, а занимаемое в памяти пространство уменьшается.
Съемка и видео
Здесь нейросети должны замыливать окружающий фон, отделять объект от окружения для закрашивания или задействовать другие эффекты, которые ранее были доступны только в постобработке видеоредакторами. Кроме того, ИИ определяет в кадре человека и удерживает фокус на нем, а также старается предугадать его движения. Можно сказать, что фотовозможности – единственная часть использования гаджета, где ИИ особенно заметен. Еще до нажатия спуска процессор обрабатывает тысячи сценариев съемки, подбирает оптимальную контрастность и другие настройки. Более того, процессор распознает животных, людей, предметы и все элементы окружения по отдельности, подбирая для всего разные настройки. ИИ участвует в стабилизации камеры, а при смещении определяет наиболее удачные участки разных снимков и объединяет их в один.
Как видно, ИИ существенно расширяет возможности операционной системы, и это только начальные предпосылки к более совершенным умным гаджетам.