
Компания в области искусственного интеллекта Anthropic ведет переговоры с британским стартапом Fractile о потенциальных поставках высокопроизводительных ИИ чипов для инференса. Соглашение направлено на диверсификацию аппаратной базы и снижение зависимости от решений лидера рынка Nvidia, пишет Yahoo!Finance.
Рост популярности ИИ сервисов, в том числе чат бота Claude от Anthropic, приводит к резкому увеличению расходов на вычисления. Инференс – то есть процесс применения обученной модели к новым данным – требует значительных вычислительных мощностей и становится одним из главных ограничителей маржинальности ИИ компаний.
По мере того, как все больше пользователей обращаются к Claude за ответами, генерацией контента и анализом данных, Anthropic вынуждена наращивать число серверов и оплачивать дорогостоящие ресурсы для обработки запросов. Это напрямую влияет на операционные издержки и рентабельность бизнеса.
Британский стартап Fractile разрабатывает инновационные чипы для задач искусственного интеллекта. Ключевая особенность решений Fractile – объединение памяти и вычислительных блоков на одном кристалле.
Такой подход позволяет сократить задержки при обмене данными между памятью и процессором, повысить общую производительность системы при работе с большими языковыми моделями (LLM) и снизить энергопотребление и операционные издержки.
По заявлениям Fractile, ее архитектура оптимизирована специально для задач инференса LLM, что делает чипы потенциально привлекательными для компаний вроде Anthropic.
Несмотря на многообещающие характеристики, чипы Fractile пока не готовы к коммерческому внедрению. По оценкам экспертов, первые серийные поставки можно ожидать не раньше 2027 года.
Это означает, что переговоры Anthropic с Fractile носят скорее стратегический характер. Anthropic делает долгосрочную ставку на появление альтернативного поставщика, который в будущем поможет снизить зависимость от доминирующих игроков рынка, прежде всего Nvidia, а также оптимизировать затраты на инфраструктуру.
Стремление Anthropic диверсифицировать вычислительные мощности отражает общий сдвиг в индустрии ИИ. Компания уже использует GPU от Nvidia для обучения и инференса моделей, TPU от Google для оптимизации отдельных рабочих нагрузок, а также Trainium от Amazon для снижения затрат на облачные вычисления.
Кроме того, Anthropic изучает возможность разработки собственных чипов. Это позволит ей лучше контролировать производительность, энергоэффективность и стоимость инфраструктуры.
Подобный подход характерен и для других крупных игроков. OpenAI, Google и Microsoft также инвестируют в специализированные ИИ ускорители и строят собственные вычислительные кластеры. В долгосрочной перспективе это может привести к перераспределению сил на рынке полупроводников и появлению новых технологических лидеров.