Quer criar o seu próprio Agente de IA? 12 modelos de LLM para guardar, você também pode treinar boas ferramentas!

Question

Quase todos os dias recebo perguntas semelhantes. Depois de ajudar a construir mais de 20 entidades de inteligência artificial e investir muito em testar modelos, concluí algumas experiências verdadeiramente eficazes.

Aqui está o guia completo sobre como escolher o LLM adequado.

Fonte da imagem: TechFlow Shenzhen

A indústria de Modelos de Linguagem de Grande Porte (LLM) está passando por mudanças rápidas. Quase todas as semanas, são lançados novos modelos, cada um deles afirmando ser o 'melhor'.

Mas a realidade é: nenhum modelo pode atender a todas as necessidades.

Cada modelo tem o seu cenário de aplicação específico.

Já testei dezenas de modelos e espero que, com a minha experiência, você possa evitar desperdício de tempo e dinheiro desnecessários.

Fonte da imagem: TechFlow Shenzhen

É importante mencionar que este artigo não se baseia em testes de laboratório ou promoção de marketing.

Vou compartilhar minha experiência prática na construção de um corpo de IA e produtos de IA generativa (GenAI) nos últimos dois anos.

Primeiro, precisamos entender o que é LLM:

O modelo de linguagem grande (LLM) é como ensinar um computador a 'falar' humano. Com base no conteúdo que você insere, ele prevê as palavras mais prováveis de aparecer a seguir.

O ponto de partida desta tecnologia é o artigo clássico: Attention Is All You Need

Noções básicas - LLM para código fechado vs. código aberto:

Código-fonte fechado: Por exemplo, GPT-4 e Claude, geralmente são pagos com base no uso e são executados em hospedagem fornecida pelo provedor.

Código aberto: por exemplo, Llama e Mixtral da Meta, precisam ser implantados e executados pelo usuário.

Quando você começa a se envolver, pode ficar confuso com esses termos, mas entender a diferença entre os dois é muito importante.

Fonte da imagem: TechFlow Shenzhen

O tamanho do modelo não é igual a um melhor desempenho:

Por exemplo, 7B significa que o modelo tem 7 bilhões de parâmetros.

No entanto, um modelo maior nem sempre é melhor. A chave está em escolher o modelo adequado para suas necessidades específicas.

Fonte da imagem: TechFlow Shenzhen

Se você precisar criar um bot X/Twitter ou IA social:

O Grok do @xai é uma ótima escolha:

Forneça uma generosa quantidade gratuita

Excelente capacidade de compreensão do contexto social

Embora seja um código-fonte fechado, vale a pena tentar.

Este modelo é altamente recomendado para iniciantes! (Videira:

O modelo padrão do Eliza da @ai16zdao está a usar XAI Grok）

Se precisar lidar com conteúdo multilíngue:

O modelo QwQ da @Alibaba_Qwen teve um desempenho muito bom em nossos testes, especialmente no processamento de linguagem asiática.

É importante notar que os dados de treinamento deste modelo são principalmente provenientes da China continental, portanto, pode haver informações ausentes em alguns conteúdos.

Fonte da imagem: TechFlow Shenzhen

Se você precisar de um modelo de uso geral ou capaz de inferência:

@OpenAI 的模型依然是業界的佼佼者：

Desempenho estável e confiável

Amplamente testado na prática

Possui um mecanismo de segurança robusto

Este é um ponto de partida ideal para a maioria dos projetos.

Fonte da imagem: TechFlow Shenzhen

Se você é um desenvolvedor ou criador de conteúdo:

@AnthropicAI 的 Claude 是我日常使用的主力工具：

As habilidades de codificação são bastante excelentes

O conteúdo da resposta é claro e detalhado.

Muito adequado para lidar com trabalhos relacionados à criatividade

Fonte da imagem: TechFlow Shenzhen

Llama 3.3 da Meta tem recebido muita atenção ultimamente:

Desempenho estável e confiável

Modelo de código aberto, flexível e livre

Você pode experimentá-lo através @OpenRouterAI ou @GroqInc

Por exemplo, projetos criptográficos x IA, como @virtuals_io, estão desenvolvendo produtos baseados nele.

Fonte da imagem: TechFlow Shenzhen

Se você precisa de IA de RPG:

O MythoMax 13B de @TheBlokeAI é atualmente um dos líderes da indústria de RPG e tem sido consistentemente classificado entre os melhores nos rankings relacionados nos últimos meses.

O Command R+ da Cohere é um modelo excelente subestimado:

Excelente em tarefas de interpretação de papéis

Capacidade de lidar com tarefas complexas com facilidade

Suporta até 128.000 janelas contextuais com "capacidades de memória" mais longas

Fonte da imagem: TechFlow Shenzhen

O modelo Gemma do Google é uma escolha leve, porém poderosa:

Foco em tarefas específicas e excel

Orçamento amigável

adequado para projetos sensíveis ao custo

Experiência pessoal: Eu frequentemente uso o modelo Gemma de pequeno porte como um 'árbitro imparcial' no fluxo de trabalho de IA e ele é muito eficaz em tarefas de verificação!

Fonte da imagem: TechFlow Shenzhen

Gemma

@MistralAI 的模型值得一提：

Open source but with high-end quality

O desempenho do modelo Mixtral é muito poderoso

Especialmente habilidoso em tarefas de raciocínio complexas

Foi bem recebido pela comunidade e definitivamente vale a pena conferir.

A vanguarda da IA nas suas mãos.

Sugestão profissional: Experimente combinações mistas!

Diferentes modelos têm suas próprias vantagens

"Equipas" de IA podem ser criadas para tarefas complexas

Permita que cada modelo se concentre na sua área de especialização

É como montar uma equipe dos sonhos, onde cada membro tem um papel e contribuição única.

Como começar rapidamente:

Teste de modelo com @OpenRouterAI ou @redpill _gpt, essas plataformas suportam pagamentos em criptomoedas, o que é muito conveniente

Uma ótima ferramenta para comparar o desempenho de diferentes modelos

Se você quiser economizar custos e executar o modelo localmente, você pode tentar usar @ollama e experimentar com sua própria GPU.

Fonte da imagem: TechFlow Shenzhen

Se estás à procura de velocidade, a tecnologia LPU da @GroqInc proporciona uma velocidade de inferência extremamente rápida:

Embora a seleção de modelos seja limitada

Mas o desempenho é muito adequado para implantação em ambientes de produção

Fonte da imagem: TechFlow Shenzhen

【免責聲明】O mercado é arriscado e o investimento deve ser feito com cautela. Este artigo não constitui um conselho de investimento e o utilizador deve considerar se quaisquer opiniões, pontos de vista ou conclusões deste artigo são adequados à sua situação específica. O investimento com base nisso é de responsabilidade própria.

Este artigo é autorizado a ser reproduzido de: "TechFlow".

Autor original: superoo7

『Quer criar o seu próprio AI Agent?』 12 modelos LLM para colecionar, você também pode ajustar boas ferramentas!" Este artigo foi publicado pela primeira vez em 'Crypto City'