A encriptação irá promover o desenvolvimento da indústria de Bots, garantindo segurança económica para os Bots e otimizando a sua infraestrutura de integração, latência e processos de coleta de dados.
Escrito por: Paul Veradittakit, sócio da Pantera Capital
Compilado por: xiaozou, Jinse Caijing
Resumo:
A inovação e os efeitos de escala da VLA estão impulsionando o surgimento de robôs humanoides acessíveis, eficientes e versáteis.
À medida que os robots de armazenamento se expandem para o mercado de robots de consumo, a segurança dos robots, o financiamento e os mecanismos de avaliação merecem uma exploração aprofundada.
A encriptação irá impulsionar o desenvolvimento da indústria de Bots, proporcionando garantias económicas para a segurança dos Bots e otimizando a sua infraestrutura de integração, latência e processos de coleta de dados.
ChatGPT revolucionou as expectativas humanas sobre a inteligência artificial. Quando os grandes modelos de linguagem começaram a interagir com o mundo de software externo, muitos acreditavam que os agentes de IA eram a forma final. Mas se olharmos para filmes clássicos de ficção científica como "Star Wars", "Blade Runner" ou "RoboCop", veremos que o verdadeiro sonho da humanidade é que a inteligência artificial possa interagir com o mundo físico na forma de Bots.
Na visão da Pantera Capital, o "momento ChatGPT" no campo dos Bots está prestes a chegar. Primeiro, vamos analisar como as quebras de inovação em inteligência artificial nos últimos anos mudaram o panorama da indústria, e em seguida discutir como a tecnologia de baterias, a otimização da latência e a melhoria da coleta de dados irão moldar o futuro, bem como o papel que a encriptação desempenha nesse contexto. Por fim, vamos explicar por que acreditamos que a segurança dos Bots, financiamento, avaliação e educação são áreas verticais que precisam de atenção especial.
1、Fatores de transformação
(1)quebra de inteligência artificial
Os avanços na área de modelos de linguagem multimodais estão a fornecer aos Bots o "cérebro" necessário para executar tarefas complexas. Os Bots percebem o ambiente principalmente através de duas sensações: visão e audição.
Modelos tradicionais de visão computacional (como redes neurais convolucionais) são proficientes em tarefas de detecção ou classificação de objetos, mas têm dificuldade em converter informações visuais em instruções de ação com propósito. Embora os grandes modelos de linguagem se destaquem na compreensão e geração de texto, eles estão limitados na capacidade de percepção do mundo físico.
Através do modelo de Visão - Linguagem - Ação (VLA), os Bots conseguem integrar a percepção visual, a compreensão da linguagem e a ação física em uma estrutura computacional unificada. Em fevereiro de 2025, a Figure AI lançou o modelo de controle de robô humanoide universal Helix, que estabelece um novo padrão na indústria com sua capacidade de generalização de zero amostras e a arquitetura de Sistema 1/Sistema 2. A característica de generalização de zero amostras permite que os Bots se adaptem instantaneamente a novos cenários, novos objetos e novas instruções, sem a necessidade de treinamento repetido para cada tarefa. A arquitetura Sistema 1/Sistema 2 separa o raciocínio de alto nível do raciocínio leve, resultando em um robô humanoide comercial com pensamento semelhante ao humano e precisão em tempo real.
(2) Os Bots económicos tornam-se realidade
A tecnologia que muda o mundo tem uma característica comum: a sua capacidade de ser amplamente adotada. Smartphones, computadores pessoais e tecnologia de impressão 3D tornaram-se acessíveis a preços que a classe média pode suportar. Quando o preço de robôs como o Unitree G1 é inferior ao de um Honda Accord ou ao rendimento mínimo anual de 34 mil dólares nos EUA, não é surpreendente imaginar um mundo em que o trabalho físico e as tarefas diárias são principalmente realizadas por robôs.
(3)da armazenagem para o mercado de consumo
A tecnologia de robôs está se expandindo das soluções de armazenamento para o setor de consumo. Este mundo foi projetado para os humanos — os humanos podem realizar todo o trabalho dos robôs profissionais, enquanto os robôs profissionais não conseguem cumprir todas as tarefas dos humanos. As empresas de robótica não estão mais limitadas à fabricação de robôs específicos para fábricas, mas estão desenvolvendo robôs humanoides mais versáteis. Portanto, a vanguarda da tecnologia de robôs não está apenas nos armazéns, mas também irá penetrar na vida cotidiana.
O custo é um dos principais gargalos da escalabilidade. O indicador que mais nos interessa é o custo total por hora, que é calculado como a soma do custo de oportunidade do tempo de treino e carregamento, do custo de execução da tarefa e do custo de aquisição dos Bots, dividido pelo total de horas de operação dos Bots. Este custo deve ser inferior ao nível médio de salários da indústria relacionada para ser competitivo.
Para uma penetração total no setor de armazenamento, o custo total dos Bots deve ser inferior a 31,39 dólares por hora. E no maior mercado de consumo - o setor de educação privada e serviços de saúde, esse custo deve ser mantido abaixo de 35,18 dólares. Atualmente, os Bots estão se desenvolvendo em direção a soluções mais baratas, mais eficientes e mais versáteis.
2、Bots技术的 próxima quebra
(1)otimização da bateria
A tecnologia das baterias tem sido um gargalo para robôs amigáveis ao usuário. Veículos elétricos como o BMW i3, no início, enfrentaram dificuldades de popularização devido às limitações da tecnologia das baterias, resultando em baixa autonomia, altos custos e baixa praticidade, e os robôs estão enfrentando um dilema semelhante. O robô Spot da Boston Dynamics tem uma autonomia de apenas 90 minutos, enquanto o Unitree G1 tem uma autonomia de cerca de 2 horas. Os usuários claramente não estão dispostos a carregar manualmente a cada duas horas, portanto, o carregamento autônomo e a infraestrutura de conexão se tornaram direções de desenvolvimento prioritárias. Atualmente, existem principalmente duas modalidades de carregamento para robôs: troca de baterias ou carregamento direto.
O modo de substituição da bateria permite a operação contínua através da rápida troca do conjunto de baterias esgotado, minimizando o tempo de inatividade, sendo adequado para cenários de campo ou fábrica. Este processo pode ser realizado manualmente ou de forma automatizada.
O carregamento por indução utiliza um método de fornecimento de energia sem fios. Embora o tempo de carregamento completo seja relativamente longo, é capaz de realizar um processo totalmente automatizado com facilidade.
(2) latência otimização
Operações de baixa latência podem ser divididas em duas categorias: percepção ambiental e controle remoto. Percepção refere-se à capacidade dos Bots de reconhecer o espaço do ambiente, enquanto controle remoto refere-se ao controle em tempo real por operadores humanos.
De acordo com a pesquisa da Cintrini, os sistemas de percepção de Bots começam com sensores baratos, mas a vantagem tecnológica reside na fusão de software, computação de baixo consumo de energia e circuitos de controle precisos em milissegundos. Quando os Bots completam a localização espacial, redes neurais leves marcam elementos como obstáculos, paletes ou humanos. Após a rotulagem da cena, o sistema de planejamento gera imediatamente comandos de motor a serem enviados para os pés, rodas ou braços mecânicos. Uma latência de percepção abaixo de 50 milissegundos é equivalente à velocidade de reflexo humano - qualquer latência que exceda esse limite resulta em movimentos desajeitados dos Bots. Portanto, 90% das decisões devem ser feitas localmente por uma única rede de visão - linguagem - ação.
Os Bots totalmente autónomos devem garantir que a latência do modelo VLA de alto desempenho seja inferior a 50 milissegundos; para Bots controlados remotamente, exige-se que a latência do sinal entre o terminal de operação e o Bots não ultrapasse os 50 milissegundos. A importância do modelo VLA é especialmente evidente aqui — se as entradas visuais e textuais forem processadas por modelos diferentes antes de serem introduzidas no modelo de linguagem de grande escala, a latência total ultrapassará o limite de 50 milissegundos.
(3)Otimização da coleta de dados
A coleta de dados pode ser feita principalmente de três maneiras: dados de vídeo do mundo real, dados sintéticos e dados de controle remoto. O principal gargalo entre dados reais e dados sintéticos está em fechar a lacuna entre o comportamento físico dos robôs e os modelos de vídeo/simulação. Os dados de vídeo do mundo real carecem de detalhes físicos, como feedback de força, erros de movimento das articulações e deformação de materiais; já os dados simulados carecem de variáveis imprevisíveis, como falhas de sensores e coeficiente de atrito.
A forma de coleta de dados com maior potencial é o controlo remoto - onde um operador humano controla remotamente os Bots para executar tarefas. Mas o custo da mão de obra é o principal fator limitante da coleta de dados por controlo remoto.
O desenvolvimento de hardware personalizado também está a fornecer novas soluções para a coleta de dados de alta qualidade. A empresa Mecka combina métodos convencionais com hardware personalizado para coletar dados de movimento humano em múltiplas dimensões, que, após processamento, são convertidos em conjuntos de dados adequados para o treinamento de redes neurais de Bots, juntamente com ciclos de iteração rápida que fornecem uma enorme quantidade de dados de alta qualidade para o treinamento de Bots de IA. Esses pipelines tecnológicos encurtam o caminho de conversão de dados brutos para Bots implantáveis.
3、Áreas de exploração-chave
(1)encriptação tecnologia e Bots融合
A encriptação pode incentivar as partes não confiáveis a melhorar a eficiência da rede de Bots. Com base nas áreas-chave mencionadas anteriormente, acreditamos que a encriptação pode melhorar a eficiência em três aspectos: integração de infraestrutura, otimização de latência e coleta de dados.
A Rede de Infraestruturas Físicas Descentralizadas (DePIN) promete revolucionar a infraestrutura de carregamento. Quando robôs humanoides operarem globalmente como automóveis, as estações de carregamento precisarão ser tão acessíveis quanto os postos de gasolina. Redes centralizadas exigem um enorme investimento inicial, enquanto o DePIN distribui os custos entre os operadores de nós, permitindo uma rápida expansão das instalações de carregamento para mais áreas.
DePIN também pode otimizar a latência de controle remoto utilizando infraestrutura distribuída. Ao agregar recursos de computação de nós de borda geograficamente dispersos, os comandos de controle remoto podem ser processados por nós locais ou os mais próximos disponíveis, minimizando a distância de transmissão de dados e reduzindo significativamente a latência de comunicação. No entanto, atualmente, os projetos DePIN estão focados principalmente em armazenamento descentralizado, distribuição de conteúdo e compartilhamento de largura de banda. Embora haja projetos que demonstrem as vantagens da computação de borda em streaming de mídia ou Internet das Coisas, ainda não se estenderam ao campo de Bots ou controle remoto.
O controlo remoto é a forma de recolha de dados mais promissora, mas o custo para entidades centralizadas contratarem profissionais para recolha de dados é extremamente alto. O DePIN resolve este problema através da encriptação de tokens que incentivam terceiros a fornecer dados de controlo remoto. O projeto Reborn constrói uma rede global de operadores remotos, convertendo as suas contribuições em ativos digitais tokenizados, formando um sistema descentralizado sem necessidade de permissão — os participantes podem não só obter lucros, mas também participar na governança e ajudar no treino de Bots AGI.
(2) A segurança é sempre uma preocupação central
O objetivo final da tecnologia de robôs é alcançar a total autonomia, mas como alertam os filmes da série "O Exterminador do Futuro", a última coisa que a humanidade deseja é que a autonomia transforme os robôs em armas agressivas. As preocupações com a segurança dos grandes modelos de linguagem já suscitaram atenção, e quando esses modelos possuem capacidade de ação física, a segurança dos robôs torna-se uma condição chave para a aceitação social.
A segurança econômica é um dos pilares da prosperidade do ecossistema de Bots. A empresa OpenMind, neste campo, está construindo o FABRIC — uma camada de coordenação de máquinas descentralizada, que realiza a autenticação de identidade dos dispositivos, verificação de presença física e acesso a recursos através de encriptação. Diferente da simples gestão de mercados de tarefas, o FABRIC permite que os Bots provem autonomamente informações de identidade, localização geográfica e registros de comportamento, sem depender de intermediários centralizados.
A restrição de comportamento e a autenticação de identidade são executadas através de mecanismos on-chain, garantindo que qualquer pessoa possa auditar a conformidade. Bots que atendem aos padrões de segurança, requisitos de qualidade e normas regionais receberão recompensas, enquanto os infratores enfrentarão penalidades ou desqualificação, estabelecendo assim um mecanismo de responsabilidade e confiança na rede de máquinas autônomas.
As redes de re-staking de terceiros (como a Symbiotic) também podem fornecer garantias de segurança equivalentes. Embora o sistema de parâmetros de penalização ainda precise ser aprimorado, a tecnologia relacionada já entrou na fase prática. Esperamos que as diretrizes de segurança do setor estejam prestes a ser formadas, e nesse momento, os parâmetros de penalização serão modelados com base nessas diretrizes.
Exemplo de plano de implementação:
Bots da empresa juntaram-se à rede Symbiotic.
Definir parâmetros de apreensão verificáveis (como "aplicar uma força de contacto humano superior a 2500 Newtons");
Os stakers fornecem margem para garantir que os Bots cumpram os parâmetros;
Se ocorrer uma violação, o depósito será utilizado como compensação para a vítima.
Este modelo incentiva as empresas a priorizar a segurança e, ao mesmo tempo, promove a aceitação dos consumidores através do mecanismo de seguro do pool de fundos em staking.
A visão da equipe Symbiotic sobre o campo dos Bots é:
O framework de staking genérico Symbiotic visa estender o conceito de staking a todos os domínios que necessitam de uma garantia econômica, seja através de um modelo compartilhado ou independente. Os seus cenários de aplicação variam do setor de seguros à tecnologia de Bots, exigindo um design específico para cada caso. Por exemplo, uma rede de Bots pode ser totalmente construída com base no framework Symbiotic, permitindo que as partes interessadas forneçam garantias econômicas para a integridade da rede.
4、Preencher as lacunas na pilha de tecnologia dos Bots
A OpenAI impulsionou a popularização da IA, mas a base do ChatGPT já estava firmemente estabelecida. Os serviços em nuvem quebraram a dependência dos modelos em relação ao poder de cálculo local, a Huggingface implementou modelos de código aberto, e o Kaggle forneceu uma plataforma de experimentação para engenheiros de IA. Esses avanços progressivos contribuíram juntos para a democratização da IA.
Ao contrário da IA, o campo dos Bots é difícil de entrar quando os fundos são limitados. Para alcançar a popularização dos Bots, o nível de desenvolvimento deve ser reduzido para um grau de conveniência semelhante ao desenvolvimento de aplicações de IA. Acreditamos que existem áreas de melhoria em três níveis: mecanismos de financiamento, sistemas de avaliação e ecossistemas educacionais.
O financiamento é um ponto crítico na área dos Bots. Desenvolver programas de computador requer apenas um computador e recursos de computação em nuvem, enquanto a construção de Bots totalmente funcionais exige a compra de motores, sensores, baterias e outros hardwares, com custos que facilmente ultrapassam 100 mil dólares. Essa característica do hardware torna o desenvolvimento de Bots menos flexível e muito mais caro em comparação com a IA.
A infraestrutura de avaliação de robôs em cenários reais ainda está em sua fase inicial. No campo da IA, um sistema claro de funções de perda foi estabelecido, e os testes podem ser totalmente virtualizados. No entanto, estratégias virtuais excelentes não podem ser diretamente traduzidas em soluções eficazes no mundo real. Os robôs precisam de instalações de avaliação de estratégias autônomas testadas em ambientes reais diversificados para conseguirem otimizar por iteração.
Quando essa infraestrutura amadurecer, talentos irão fluir em massa, e os robôs humanoides irão repetir a curva de explosão do Web2. A empresa de robôs encriptados OpenMind está avançando nessa direção - seu projeto de código aberto OM1 ("sistema Android para robôs") transforma hardware original em agentes inteligentes atualizáveis com consciência econômica. Módulos de visão, linguagem e planejamento de movimento podem ser plug-and-play como aplicativos de telefone, e todos os passos de raciocínio são apresentados em inglês claro, permitindo que os operadores auditem ou ajustem comportamentos sem interagir com o firmware. Essa capacidade de raciocínio em linguagem natural permite que a nova geração de talentos entre sem problemas no campo dos robôs, dando um passo crucial em direção a uma plataforma aberta que irá desencadear a revolução dos robôs, assim como o movimento de código aberto acelerou a IA.
A densidade de talentos determina a trajetória da indústria. Um sistema educacional inclusivo e estruturado é crucial para o fornecimento de talentos na área de Bots. A entrada da OpenMind na Nasdaq marca a abertura de uma nova era em que máquinas inteligentes participam simultaneamente da inovação financeira e da educação básica. A OpenMind e a Robostore anunciaram em conjunto que lançarão o primeiro curso de educação universal baseado no robô humanoide Unitree G1 nas escolas públicas K-12 dos EUA. O curso é projetado para ser independente de plataforma, podendo se adaptar a diversas formas de robôs, proporcionando aos alunos oportunidades de prática. Este sinal positivo reforça nosso julgamento: nos próximos anos, a riqueza de recursos educacionais em Bots será comparável à do campo da IA.
5、Perspectivas Futuras
A inovação e os efeitos de escala do modelo de ação de linguagem visual (VLA) já deram origem a robôs humanos acessíveis, eficientes e universais. À medida que os robôs de armazém se expandem para o mercado de consumo, a segurança, os modelos de financiamento e os sistemas de avaliação tornam-se direções de exploração chave. Acreditamos firmemente que a encriptação irá impulsionar o desenvolvimento dos robôs através de três caminhos: fornecer garantias econômicas para a segurança, otimizar a infraestrutura de carregamento e melhorar o desempenho de latência e os canais de coleta de dados.
Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
Pantera parceiros: a era dos Bots impulsionados por encriptação
Escrito por: Paul Veradittakit, sócio da Pantera Capital
Compilado por: xiaozou, Jinse Caijing
Resumo:
A inovação e os efeitos de escala da VLA estão impulsionando o surgimento de robôs humanoides acessíveis, eficientes e versáteis.
À medida que os robots de armazenamento se expandem para o mercado de robots de consumo, a segurança dos robots, o financiamento e os mecanismos de avaliação merecem uma exploração aprofundada.
A encriptação irá impulsionar o desenvolvimento da indústria de Bots, proporcionando garantias económicas para a segurança dos Bots e otimizando a sua infraestrutura de integração, latência e processos de coleta de dados.
ChatGPT revolucionou as expectativas humanas sobre a inteligência artificial. Quando os grandes modelos de linguagem começaram a interagir com o mundo de software externo, muitos acreditavam que os agentes de IA eram a forma final. Mas se olharmos para filmes clássicos de ficção científica como "Star Wars", "Blade Runner" ou "RoboCop", veremos que o verdadeiro sonho da humanidade é que a inteligência artificial possa interagir com o mundo físico na forma de Bots.
Na visão da Pantera Capital, o "momento ChatGPT" no campo dos Bots está prestes a chegar. Primeiro, vamos analisar como as quebras de inovação em inteligência artificial nos últimos anos mudaram o panorama da indústria, e em seguida discutir como a tecnologia de baterias, a otimização da latência e a melhoria da coleta de dados irão moldar o futuro, bem como o papel que a encriptação desempenha nesse contexto. Por fim, vamos explicar por que acreditamos que a segurança dos Bots, financiamento, avaliação e educação são áreas verticais que precisam de atenção especial.
1、Fatores de transformação
(1)quebra de inteligência artificial
Os avanços na área de modelos de linguagem multimodais estão a fornecer aos Bots o "cérebro" necessário para executar tarefas complexas. Os Bots percebem o ambiente principalmente através de duas sensações: visão e audição.
Modelos tradicionais de visão computacional (como redes neurais convolucionais) são proficientes em tarefas de detecção ou classificação de objetos, mas têm dificuldade em converter informações visuais em instruções de ação com propósito. Embora os grandes modelos de linguagem se destaquem na compreensão e geração de texto, eles estão limitados na capacidade de percepção do mundo físico.
Através do modelo de Visão - Linguagem - Ação (VLA), os Bots conseguem integrar a percepção visual, a compreensão da linguagem e a ação física em uma estrutura computacional unificada. Em fevereiro de 2025, a Figure AI lançou o modelo de controle de robô humanoide universal Helix, que estabelece um novo padrão na indústria com sua capacidade de generalização de zero amostras e a arquitetura de Sistema 1/Sistema 2. A característica de generalização de zero amostras permite que os Bots se adaptem instantaneamente a novos cenários, novos objetos e novas instruções, sem a necessidade de treinamento repetido para cada tarefa. A arquitetura Sistema 1/Sistema 2 separa o raciocínio de alto nível do raciocínio leve, resultando em um robô humanoide comercial com pensamento semelhante ao humano e precisão em tempo real.
(2) Os Bots económicos tornam-se realidade
A tecnologia que muda o mundo tem uma característica comum: a sua capacidade de ser amplamente adotada. Smartphones, computadores pessoais e tecnologia de impressão 3D tornaram-se acessíveis a preços que a classe média pode suportar. Quando o preço de robôs como o Unitree G1 é inferior ao de um Honda Accord ou ao rendimento mínimo anual de 34 mil dólares nos EUA, não é surpreendente imaginar um mundo em que o trabalho físico e as tarefas diárias são principalmente realizadas por robôs.
(3)da armazenagem para o mercado de consumo
A tecnologia de robôs está se expandindo das soluções de armazenamento para o setor de consumo. Este mundo foi projetado para os humanos — os humanos podem realizar todo o trabalho dos robôs profissionais, enquanto os robôs profissionais não conseguem cumprir todas as tarefas dos humanos. As empresas de robótica não estão mais limitadas à fabricação de robôs específicos para fábricas, mas estão desenvolvendo robôs humanoides mais versáteis. Portanto, a vanguarda da tecnologia de robôs não está apenas nos armazéns, mas também irá penetrar na vida cotidiana.
O custo é um dos principais gargalos da escalabilidade. O indicador que mais nos interessa é o custo total por hora, que é calculado como a soma do custo de oportunidade do tempo de treino e carregamento, do custo de execução da tarefa e do custo de aquisição dos Bots, dividido pelo total de horas de operação dos Bots. Este custo deve ser inferior ao nível médio de salários da indústria relacionada para ser competitivo.
Para uma penetração total no setor de armazenamento, o custo total dos Bots deve ser inferior a 31,39 dólares por hora. E no maior mercado de consumo - o setor de educação privada e serviços de saúde, esse custo deve ser mantido abaixo de 35,18 dólares. Atualmente, os Bots estão se desenvolvendo em direção a soluções mais baratas, mais eficientes e mais versáteis.
2、Bots技术的 próxima quebra
(1)otimização da bateria
A tecnologia das baterias tem sido um gargalo para robôs amigáveis ao usuário. Veículos elétricos como o BMW i3, no início, enfrentaram dificuldades de popularização devido às limitações da tecnologia das baterias, resultando em baixa autonomia, altos custos e baixa praticidade, e os robôs estão enfrentando um dilema semelhante. O robô Spot da Boston Dynamics tem uma autonomia de apenas 90 minutos, enquanto o Unitree G1 tem uma autonomia de cerca de 2 horas. Os usuários claramente não estão dispostos a carregar manualmente a cada duas horas, portanto, o carregamento autônomo e a infraestrutura de conexão se tornaram direções de desenvolvimento prioritárias. Atualmente, existem principalmente duas modalidades de carregamento para robôs: troca de baterias ou carregamento direto.
O modo de substituição da bateria permite a operação contínua através da rápida troca do conjunto de baterias esgotado, minimizando o tempo de inatividade, sendo adequado para cenários de campo ou fábrica. Este processo pode ser realizado manualmente ou de forma automatizada.
O carregamento por indução utiliza um método de fornecimento de energia sem fios. Embora o tempo de carregamento completo seja relativamente longo, é capaz de realizar um processo totalmente automatizado com facilidade.
(2) latência otimização
Operações de baixa latência podem ser divididas em duas categorias: percepção ambiental e controle remoto. Percepção refere-se à capacidade dos Bots de reconhecer o espaço do ambiente, enquanto controle remoto refere-se ao controle em tempo real por operadores humanos.
De acordo com a pesquisa da Cintrini, os sistemas de percepção de Bots começam com sensores baratos, mas a vantagem tecnológica reside na fusão de software, computação de baixo consumo de energia e circuitos de controle precisos em milissegundos. Quando os Bots completam a localização espacial, redes neurais leves marcam elementos como obstáculos, paletes ou humanos. Após a rotulagem da cena, o sistema de planejamento gera imediatamente comandos de motor a serem enviados para os pés, rodas ou braços mecânicos. Uma latência de percepção abaixo de 50 milissegundos é equivalente à velocidade de reflexo humano - qualquer latência que exceda esse limite resulta em movimentos desajeitados dos Bots. Portanto, 90% das decisões devem ser feitas localmente por uma única rede de visão - linguagem - ação.
Os Bots totalmente autónomos devem garantir que a latência do modelo VLA de alto desempenho seja inferior a 50 milissegundos; para Bots controlados remotamente, exige-se que a latência do sinal entre o terminal de operação e o Bots não ultrapasse os 50 milissegundos. A importância do modelo VLA é especialmente evidente aqui — se as entradas visuais e textuais forem processadas por modelos diferentes antes de serem introduzidas no modelo de linguagem de grande escala, a latência total ultrapassará o limite de 50 milissegundos.
(3)Otimização da coleta de dados
A coleta de dados pode ser feita principalmente de três maneiras: dados de vídeo do mundo real, dados sintéticos e dados de controle remoto. O principal gargalo entre dados reais e dados sintéticos está em fechar a lacuna entre o comportamento físico dos robôs e os modelos de vídeo/simulação. Os dados de vídeo do mundo real carecem de detalhes físicos, como feedback de força, erros de movimento das articulações e deformação de materiais; já os dados simulados carecem de variáveis imprevisíveis, como falhas de sensores e coeficiente de atrito.
A forma de coleta de dados com maior potencial é o controlo remoto - onde um operador humano controla remotamente os Bots para executar tarefas. Mas o custo da mão de obra é o principal fator limitante da coleta de dados por controlo remoto.
O desenvolvimento de hardware personalizado também está a fornecer novas soluções para a coleta de dados de alta qualidade. A empresa Mecka combina métodos convencionais com hardware personalizado para coletar dados de movimento humano em múltiplas dimensões, que, após processamento, são convertidos em conjuntos de dados adequados para o treinamento de redes neurais de Bots, juntamente com ciclos de iteração rápida que fornecem uma enorme quantidade de dados de alta qualidade para o treinamento de Bots de IA. Esses pipelines tecnológicos encurtam o caminho de conversão de dados brutos para Bots implantáveis.
3、Áreas de exploração-chave
(1)encriptação tecnologia e Bots融合
A encriptação pode incentivar as partes não confiáveis a melhorar a eficiência da rede de Bots. Com base nas áreas-chave mencionadas anteriormente, acreditamos que a encriptação pode melhorar a eficiência em três aspectos: integração de infraestrutura, otimização de latência e coleta de dados.
A Rede de Infraestruturas Físicas Descentralizadas (DePIN) promete revolucionar a infraestrutura de carregamento. Quando robôs humanoides operarem globalmente como automóveis, as estações de carregamento precisarão ser tão acessíveis quanto os postos de gasolina. Redes centralizadas exigem um enorme investimento inicial, enquanto o DePIN distribui os custos entre os operadores de nós, permitindo uma rápida expansão das instalações de carregamento para mais áreas.
DePIN também pode otimizar a latência de controle remoto utilizando infraestrutura distribuída. Ao agregar recursos de computação de nós de borda geograficamente dispersos, os comandos de controle remoto podem ser processados por nós locais ou os mais próximos disponíveis, minimizando a distância de transmissão de dados e reduzindo significativamente a latência de comunicação. No entanto, atualmente, os projetos DePIN estão focados principalmente em armazenamento descentralizado, distribuição de conteúdo e compartilhamento de largura de banda. Embora haja projetos que demonstrem as vantagens da computação de borda em streaming de mídia ou Internet das Coisas, ainda não se estenderam ao campo de Bots ou controle remoto.
O controlo remoto é a forma de recolha de dados mais promissora, mas o custo para entidades centralizadas contratarem profissionais para recolha de dados é extremamente alto. O DePIN resolve este problema através da encriptação de tokens que incentivam terceiros a fornecer dados de controlo remoto. O projeto Reborn constrói uma rede global de operadores remotos, convertendo as suas contribuições em ativos digitais tokenizados, formando um sistema descentralizado sem necessidade de permissão — os participantes podem não só obter lucros, mas também participar na governança e ajudar no treino de Bots AGI.
(2) A segurança é sempre uma preocupação central
O objetivo final da tecnologia de robôs é alcançar a total autonomia, mas como alertam os filmes da série "O Exterminador do Futuro", a última coisa que a humanidade deseja é que a autonomia transforme os robôs em armas agressivas. As preocupações com a segurança dos grandes modelos de linguagem já suscitaram atenção, e quando esses modelos possuem capacidade de ação física, a segurança dos robôs torna-se uma condição chave para a aceitação social.
A segurança econômica é um dos pilares da prosperidade do ecossistema de Bots. A empresa OpenMind, neste campo, está construindo o FABRIC — uma camada de coordenação de máquinas descentralizada, que realiza a autenticação de identidade dos dispositivos, verificação de presença física e acesso a recursos através de encriptação. Diferente da simples gestão de mercados de tarefas, o FABRIC permite que os Bots provem autonomamente informações de identidade, localização geográfica e registros de comportamento, sem depender de intermediários centralizados.
A restrição de comportamento e a autenticação de identidade são executadas através de mecanismos on-chain, garantindo que qualquer pessoa possa auditar a conformidade. Bots que atendem aos padrões de segurança, requisitos de qualidade e normas regionais receberão recompensas, enquanto os infratores enfrentarão penalidades ou desqualificação, estabelecendo assim um mecanismo de responsabilidade e confiança na rede de máquinas autônomas.
As redes de re-staking de terceiros (como a Symbiotic) também podem fornecer garantias de segurança equivalentes. Embora o sistema de parâmetros de penalização ainda precise ser aprimorado, a tecnologia relacionada já entrou na fase prática. Esperamos que as diretrizes de segurança do setor estejam prestes a ser formadas, e nesse momento, os parâmetros de penalização serão modelados com base nessas diretrizes.
Exemplo de plano de implementação:
Este modelo incentiva as empresas a priorizar a segurança e, ao mesmo tempo, promove a aceitação dos consumidores através do mecanismo de seguro do pool de fundos em staking.
A visão da equipe Symbiotic sobre o campo dos Bots é:
O framework de staking genérico Symbiotic visa estender o conceito de staking a todos os domínios que necessitam de uma garantia econômica, seja através de um modelo compartilhado ou independente. Os seus cenários de aplicação variam do setor de seguros à tecnologia de Bots, exigindo um design específico para cada caso. Por exemplo, uma rede de Bots pode ser totalmente construída com base no framework Symbiotic, permitindo que as partes interessadas forneçam garantias econômicas para a integridade da rede.
4、Preencher as lacunas na pilha de tecnologia dos Bots
A OpenAI impulsionou a popularização da IA, mas a base do ChatGPT já estava firmemente estabelecida. Os serviços em nuvem quebraram a dependência dos modelos em relação ao poder de cálculo local, a Huggingface implementou modelos de código aberto, e o Kaggle forneceu uma plataforma de experimentação para engenheiros de IA. Esses avanços progressivos contribuíram juntos para a democratização da IA.
Ao contrário da IA, o campo dos Bots é difícil de entrar quando os fundos são limitados. Para alcançar a popularização dos Bots, o nível de desenvolvimento deve ser reduzido para um grau de conveniência semelhante ao desenvolvimento de aplicações de IA. Acreditamos que existem áreas de melhoria em três níveis: mecanismos de financiamento, sistemas de avaliação e ecossistemas educacionais.
O financiamento é um ponto crítico na área dos Bots. Desenvolver programas de computador requer apenas um computador e recursos de computação em nuvem, enquanto a construção de Bots totalmente funcionais exige a compra de motores, sensores, baterias e outros hardwares, com custos que facilmente ultrapassam 100 mil dólares. Essa característica do hardware torna o desenvolvimento de Bots menos flexível e muito mais caro em comparação com a IA.
A infraestrutura de avaliação de robôs em cenários reais ainda está em sua fase inicial. No campo da IA, um sistema claro de funções de perda foi estabelecido, e os testes podem ser totalmente virtualizados. No entanto, estratégias virtuais excelentes não podem ser diretamente traduzidas em soluções eficazes no mundo real. Os robôs precisam de instalações de avaliação de estratégias autônomas testadas em ambientes reais diversificados para conseguirem otimizar por iteração.
Quando essa infraestrutura amadurecer, talentos irão fluir em massa, e os robôs humanoides irão repetir a curva de explosão do Web2. A empresa de robôs encriptados OpenMind está avançando nessa direção - seu projeto de código aberto OM1 ("sistema Android para robôs") transforma hardware original em agentes inteligentes atualizáveis com consciência econômica. Módulos de visão, linguagem e planejamento de movimento podem ser plug-and-play como aplicativos de telefone, e todos os passos de raciocínio são apresentados em inglês claro, permitindo que os operadores auditem ou ajustem comportamentos sem interagir com o firmware. Essa capacidade de raciocínio em linguagem natural permite que a nova geração de talentos entre sem problemas no campo dos robôs, dando um passo crucial em direção a uma plataforma aberta que irá desencadear a revolução dos robôs, assim como o movimento de código aberto acelerou a IA.
A densidade de talentos determina a trajetória da indústria. Um sistema educacional inclusivo e estruturado é crucial para o fornecimento de talentos na área de Bots. A entrada da OpenMind na Nasdaq marca a abertura de uma nova era em que máquinas inteligentes participam simultaneamente da inovação financeira e da educação básica. A OpenMind e a Robostore anunciaram em conjunto que lançarão o primeiro curso de educação universal baseado no robô humanoide Unitree G1 nas escolas públicas K-12 dos EUA. O curso é projetado para ser independente de plataforma, podendo se adaptar a diversas formas de robôs, proporcionando aos alunos oportunidades de prática. Este sinal positivo reforça nosso julgamento: nos próximos anos, a riqueza de recursos educacionais em Bots será comparável à do campo da IA.
5、Perspectivas Futuras
A inovação e os efeitos de escala do modelo de ação de linguagem visual (VLA) já deram origem a robôs humanos acessíveis, eficientes e universais. À medida que os robôs de armazém se expandem para o mercado de consumo, a segurança, os modelos de financiamento e os sistemas de avaliação tornam-se direções de exploração chave. Acreditamos firmemente que a encriptação irá impulsionar o desenvolvimento dos robôs através de três caminhos: fornecer garantias econômicas para a segurança, otimizar a infraestrutura de carregamento e melhorar o desempenho de latência e os canais de coleta de dados.