Tencent Hunyuan знову представляє відкритий вихідний код AI! Модель Hunyuan-A13B з'явилася, параметри 13B кидають виклик гіганту 80B

2025-07-01 04:39:28

Генерація анотацій у процесі

З моменту, коли генеративний ШІ вступив у нову стадію, хоча великі моделі є потужними, вони також супроводжуються високими витратами на ресурси та складністю розгортання. Остання версія відкритого вихідного коду великої мовної моделі Hunyuan-A13B від Tencent Hunyuan прокладає новий шлях легкості та ефективності: хоча вона має в загальному 80 мільярдів параметрів, під час кожної інференції активуються лише 13 мільярдів параметрів. Завдяки архітектурі "Mixture-of-Experts (MoE)" значно зменшуються витрати на інференцію, не жертвуючи при цьому розумінням мови та здатністю до інференції.

Подолання обмежень ефективності та ресурсів: технічний аналіз Hunyuan-A13B

Hunyuan-A13B використовує розріджену архітектуру MoE, яка має 64 експертних модулі та одного спільного експерта, при кожному висновуванні активуються лише 8 експертів, в поєднанні з активаційною функцією SwiGLU та технологією GQA (Групова увага до запитів), що дозволяє ефективно підвищити ефективність використання пам'яті та пропускну здатність висновків.

Крім того, обсяг його попередньо навчених даних досягає 20 трильйонів токенів, з яких 250 мільярдів складають високоякісні дані з області STEM, що підсилює продуктивність моделі в математичних, наукових і логічних висновках. Загальний процес навчання пройшов три основні етапи: базове попереднє навчання, швидка відпустка навчання та розширене навчання з довгим контекстом, в результаті чого підтримується здатність обробки контексту до 256K токенів.

Вибір між двома режимами: швидкий vs. глибоке мислення з вільним перемиканням

Hunyuan-A13B спеціально впроваджує двомодальний механізм міркування (Dual-mode Chain-of-Thought), автоматично перемикаючись між режимами «швидкого мислення» та «повільного мислення» в залежності від складності завдання. Швидке мислення підходить для щоденних простих запитів, підкреслюючи низьку затримку та високу ефективність; повільне мислення активує довші шляхи міркування Chain-of-Thought, обробляючи багатоетапну логіку та складні проблеми висновків, балансуючи точність та використання ресурсів.

Результати тестування вражаючі

У багатьох визнаних бенчмарках Hunyuan-A13B показав відмінні результати. Він зайняв перше місце в математичному мисленні (як AIME 2024, MATH) та був серед лідерів у логічному мисленні (як BBH, ZebraLogic). Навіть у більш вимогливих тестах на довгий текст, таких як LongBench-v2 та RULER, Hunyuan-A13B продемонстрував вражаючу здатність зберігати контекст і логічно інтегрувати інформацію, перевершивши Qwen3-A22B і DeepSeek-R1, які мають значно більше параметрів.

Стикаючись з викликами відкритого середовища, можливості виклику інструментів повністю оновлюються.

Окрім мовних і аналітичних здібностей, Hunyuan-A13B також значно покращив можливості Агентів. У тестах, таких як BFCL v3, ComplexFuncBench, спрямованих на виклик інструментів, планування та багатократні діалоги, його результати не лише перевершують Qwen3-A22B, але й займають перше місце в тестах C3-Bench, демонструючи свою потужну здатність адаптуватися до складних робочих процесів.

Продуктивність висновків зашкалює, ефективність розгортання заслуговує на увагу.

Згідно з доповіддю, Hunyuan-A13B вразив також ефективністю інференції. У поєднанні з наявними фреймворками для інференції, такими як vLLM, TensorRT-LLM тощо, при 32 пакетах і вихідній довжині 14K токенів, можна досягти майже 2000 токенів/с. При використанні INT8, FP8 та інших квантованих точностей також можна зберегти продуктивність, що є критично важливим для впровадження в бізнес.

Висока ефективність та висока вартість - це новий вибір для відкритого вихідного коду моделі.

Tencent встановлює новий стандарт у світі відкритого вихідного коду мовних моделей через Hunyuan-A13B. Ця модель не лише руйнує стереотип «малі моделі не можуть змагатися з великими», але й забезпечує гнучке міркування та можливості адаптації до багатьох завдань, ставши новим флагманом у галузі відкритих LLM. Для розробників і компаній з обмеженими ресурсами, які все ще прагнуть ефективних AI-рішень, Hunyuan-A13B безсумнівно є потужним новим вибором, на який варто звернути увагу.

Ця стаття Tencent Hunyuan знову представляє відкритий вихідний код AI! Модель Hunyuan-A13B представлена, 13B параметрів кидає виклик 80B монстру, вперше з'явилася в Chain News ABMedia.

B-1.85%

Переглянути оригінал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
Gate Hits 30 Million Users
11k Популярність
Solana Staking ETF
15k Популярність
Trump’s Tax Reform
36k Популярність
4BTC
30004k Популярність
5contentstar
10718k Популярність
6NADA
11185k Популярність
7BOME
11562k Популярність
8BTC
30004k Популярність
9SMILE
9061k Популярність
10比特币
13223k Популярність

Закріпити

карта сайту