Математики придумали более простой способ умножения матриц — он может стать основой прорыва в ИИ

В основе искусственного интеллекта лежит матричное исчисление, которое только что пережило самый большой подъем более чем за десятилетие. Почти одновременно вышли две статьи, в которых математики объяснили, как повысить эффективность перемножения матриц. С помощью новых алгоритмов искусственный интеллект сможет быстрее обучаться на менее мощном оборудовании и таким же образом быстрее решать задачи.

Суть проблемы в том, что до относительно недавнего времени человечество в лице математиков не представляло иного способа умножения матриц, чем выполнением n3 операций (где n — размерность матриц). Для матрицы 3 × 3, к примеру, необходимо было совершить 27 умножений. В идеальном же для математиков мире умножение матриц хотелось совершать за n2 операций. И к началу 70-х годов процесс поиска соответствующего алгоритма пошёл. Нетрудно догадаться, что к этому побудило распространение вычислительных машин.

Значительный прогресс в данной сфере совершил в 1981 году математик Арнольд Шёнхаге. Он доказал, что умножение матриц можно выполнить за n2,522 шагов. Позже этот метод был назван «лазерным методом» (laser method). Все последующие продвижения к заветной «второй степени» базировались на улучшениях лазерного метода.

Заявленный в новых статьях прорыв, совершённый в 2023 году, произошёл в результате обнаружения «скрытых потерь» в лазерном методе. В ноябре 2023 года Ран Дуань и Ренфэй Чжоу из Университета Цинхуа представили метод, который устранил неэффективность лазерного метода, установив новую верхнюю границу числа необходимых операций примерно на уровне n2,371866. Это достижение ознаменовало самый существенный прогресс в этой области с 2010 года. Но всего два месяца спустя Вирджиния Василевски Уильямс, Инчжан Сюй и Цзысюань Сюй из Массачусетского технологического института опубликовали вторую статью, в которой подробно описали ещё одну оптимизацию, которая снизила верхнюю границу количества операций до n2,371552.

Безусловно, точное влияние на скорость работы моделей искусственного интеллекта зависит от конкретной аппаратной архитектуры системы ИИ и от того, насколько сильно задачи конкретной модели зависят от умножения матриц. Поэтому повышение эффективности алгоритмов будут сочетать с оптимизацией оборудования, чтобы полностью реализовать потенциальный прирост скорости. Но все же, по мере того, как улучшения в алгоритмических методах будут накапливаться с течением времени, искусственный интеллект будет становиться быстрее — это факт.

Источник

Математики придумали более простой способ умножения матриц — он может стать основой прорыва в ИИ

О *

Добавить комментарий Отменить ответ

Заявления руководства Alphabet, Microsoft и Meta✴ подняли капитализацию Nvidia на 15 %

Google расширила центр исследований и разработки на Тайване

Проблемы в Intel копились десятилетиями, и инвесторы не верят, что Гелсингер спасёт компанию

Госсекретарь США считает, что существование новейшего ноутбука Huawei доказывает избирательность санкций

Китайцы начали выпускать Radeon RX 6600 LE — вариант RX 6600 с разгоном на 0,16 %

Intel пожаловалась на производственные проблемы при сборке Core Ultra — из-за этого процессоров не хватает

Обзор QD-OLED DQHD-монитора Samsung Odyssey OLED G9 G95SC: игровой универсал

Регулятор в США проверит декабрьское обновление автопилота Tesla, которое должно было улучшить безопасность

Apple возобновила переговоры с OpenAI по поводу внедрения ИИ в iPhone нового поколения

В США вернули сетевой нейтралитет

Hisense представила ультракороткофокусный лазерный 4K-проектор PX3-PRO для геймеров и киноманов

Видеокарты MSI семейства Radeon RX пропадают с прилавков — компания «сместила фокус» на GeForce RTX

О *

Похожие записи

Добавить комментарий Отменить ответ