DeepSeek IA: Especialistas levantam dúvidas sobre a nova sensação chinesa
Alegações de custos baixos e eficiência surpreendente enfrentam ceticismo no mercado global

O modelo de inteligência artificial DeepSeek R1, apresentado recentemente pela startup chinesa DeepSeek, vem chamando a atenção no setor de tecnologia. No entanto, enquanto parte da comunidade celebra seus avanços, especialistas têm demonstrado cautela, questionando as afirmações da empresa sobre eficiência, custo de desenvolvimento e o real impacto de sua tecnologia.
Custos “milagrosos” sob suspeita
Um dos principais atrativos do DeepSeek R1 é a alegação de que seu treinamento foi realizado com um custo consideravelmente baixo: apenas 2,78 milhões de horas em GPUs H800, com chips menos potentes que os usados por concorrentes como a OpenAI. Esse número representa uma redução de 95% no tempo necessário para treinar modelos como o GPT-4, que demandou cerca de 60 milhões de horas em GPUs A100, mais avançadas.
Analistas da Citi e da Bernstein, no entanto, consideram esses números pouco plausíveis. Há indícios de que a startup possa ter utilizado GPUs mais potentes, como as H100, mas omitido essa informação para não violar as restrições comerciais impostas pelos Estados Unidos.
“É difícil acreditar que um modelo dessa complexidade tenha sido treinado com tão poucos recursos. Provavelmente estamos lidando com uma redução dos custos reais”, disse um analista da Bernstein.
Origem dos dados: questões éticas e técnicas
Outra crítica envolve o treinamento do modelo. Há suspeitas de que o DeepSeek R1 tenha se beneficiado de dados gerados por sistemas rivais, como o ChatGPT, acessados por meio de fontes públicas. Essa prática pode levantar problemas éticos, uma vez que o modelo pode estar se apropriando de informações protegidas por direitos autorais.
Relatos também indicam que, em algumas interações, o DeepSeek apresenta respostas semelhantes às fornecidas por modelos de outras empresas, sugerindo que o treinamento pode ter sido parcialmente baseado nesses dados.
Autocensura e manipuções políticas
O DeepSeek também tem sido alvo de críticas por seu viés político. O modelo evita responder a questões sensíveis ao regime chinês, como os protestos da Praça da Paz Celestial ou temas relacionados à independência de Taiwan.
Essa autocensura reforça preocupações sobre a utilidade da tecnologia em contextos internacionais.
O lançamento do DeepSeek R1 causou turbulências no mercado financeiro, com ações da Nvidia e de outras gigantes de tecnologia caindo significativamente. A ideia de que modelos eficientes podem ser treinados com menos recursos gerou dúvidas sobre a necessidade de GPUs avançadas em larga escala, impactando diretamente as perspectivas de crescimento de empresas como a Nvidia.
Embora o DeepSeek R1 tenha gerado expectativas com seus avanços técnicos e baixos custos, especialistas continuam cautelosos. A falta de transparência no processo de desenvolvimento, as questões éticas envolvendo dados de treinamento e as limitações impostas por sua autocensura política deixam dúvidas sobre a real capacidade do modelo de competir globalmente.
O DeepSeek pode ter balançado o mercado de tecnologia, mas seu impacto de longo prazo dependerá de sua capacidade de superar as incertezas que hoje cercam a startup chinesa e seu ambicioso modelo de inteligência artificial.
Os comentários não representam a opinião do site; a responsabilidade pelo conteúdo postado é do autor da mensagem.
Comentários (0)