Startup cria robô capaz de realizar tarefas sem programação prévia
A startup Physical Intelligence revelou um modelo robótico capaz de resolver tarefas para as quais nunca foi treinado. Chamado π0.7, o modelo reproduz um fenômeno técnico chamado generalização composicional: isso implica que ele une habilidades utilizadas em outros contextos para entender o que fazer diante de um problema inédito. É um processo comum no cérebro humano para lidar com cenários ainda não explorados e, agora, possível em robôs.
Foram duas as cenas destacadas pela empresa de São Francisco como exemplos da técnica. Uma delas revela um robô que conseguiu assar uma batata-doce em uma air fryer sem ter conhecimento prévio de como realizar a ação. A segunda mostrou um outro robô fazendo o movimento de fechar a gaveta do equipamento de cozinha por conta própria. Em outra ocasião, o modelo seguiu as instruções de uym humano para colocar uma garrafa de plástico na gaveta e fechá-la.
A equipe, entretanto, aponta que o modelo tem capacidade limitada. “Às vezes, a falha não está no robô ouno modelo. Está em nós. Em não sermos bons em engenharia ágil", comentou Lucy Shi, pesquisadora da empresa, ao TechCrunch. As ações dos robôs com a air fryer tiveram 5% de taxa de sucesso quando os modelos não tinham instruções do que fazer, mas ações guiadas por humanos fizeram a eficácia subir para 95%.
Empresa se apoia no otimismo, mas futuro é incerto
O modelo ainda não consegue executar sequências longas de ações a partir de um único comando de alto nível. Pedir que ele faça uma torrada do começo ao fim, por exemplo, não funciona. A orientação precisa ser feita etapa por etapa para funcionar. Outro complicador estrutural é a ausência de benchmarks padronizados e amplamente aceitos. Isso torna a validação externa das afirmações da empresa difícil.
Os resultados que apontam estágios iniciais de generalização composicional no π0.7 surgiram após comparações com modelos anteriores da Physical Intelligente. Isso dificulta a entrada do modelo no mercado de forma viável, uma vez que não há comparação justa para confirmação de hipóteses.
A empresa captou mais de US$ 1 bilhão desde sua fundação e estava avaliada em US$ 5,6 bilhões na última rodada de investimentos. Há relatos de negociações em andamento para uma nova captação que quase dobraria esse valor, levando o valuation a US$ 11 bilhões. Parte do entusiasmo dos investidores vem do histórico de Lachy Groom, cofundador que construiu uma reputação como um dos anjos mais reconhecidos no Vale do Silício.
O histórico de Groom com empresas como Figma e Notion atraiu capital institucional de valor para a startup. Normalmente, a ausência de previsão de lançamento para produtos afasta investidores do setor, mas a confiança que Groom passa para a Physical Intelligence a coloca em uma posição diferenciada. Sergey Levine, outro cofundador da empresa, disse ao TechCrunch que o projeto está "progredindo mais rápido do que o esperado" e "há boa razão para ser otimista", mas o π0.7 ainda ficará um tempo relevante em testes.
Nenhum comentário disponível no momento.
Comentários
Deixe seu comentário abaixo: