"Nosso verdadeiro desafio nunca foi o financiamento, mas a proibição da exportação de chips de última geração", disse em uma entrevista recente, o fundador da DeepSeek, Liang Wenfeng, em referência às restrições impostas pelos Estados Unidos às exportações de semicondutores para a China.
Foi por causa das ações dos Estados Unidos contra a indústria de chips chineses que a DeepSeek e outras equipes chinesas de Inteligência Artificial começaram a buscar se poderiam melhorar o algoritmo e o modo de treinamento de Grandes Modelos de Linguagem (LLM na sigla em inglês), afirma Zhuang Fei, diretor de conteúdo da Wave Media.
O especialista em Internet e tecnologia considera que a proibição de exportar os chips mais avançados para a China "forçou os programadores e engenheiros chineses a inovar". "Eles finalmente descobriram que poderiam obter melhores resultados por meio da inovação [e não de chips mais avançados]".
A startup chinesa DeepSeek causou um grande impacto no setor de Inteligência Artificial (IA) no mês passado, quando lançou seu último modelo de Inteligência Artificial DeepSeek R1, de código aberto, o que significa que qualquer pessoa pode acessar, modificar e distribuí-lo.
O lançamento causou a maior queda de valor de uma empresa na bolsa em apenas um dia nos Estados Unidos. A empresa Nvidia perdeu quase 600 bilhões de dólares (cerca de R$ 3,5 trilhões), 17% do seu valor.
A razão é que a ferramenta da DeepSeek conseguiu ter um desempenho similar aos dos modelos mais avançados sem utilizar os chips mais poderosos e com significativamente menos recursos que as empresas do setor como a OpenAI, de Sam Altman e a Meta, de Mark Zuckerberg, ambas dos Estados Unidos. Cerca de 80% do mercado de chips de IA é dominado pela Nvidia.
Foco em inovação não em lucro
Para Zhuang Fei, o surgimento do DeepSeek pode ter transformado para sempre a indústria da IA passando de ser um setor intensivo em investimento e capital para ser intensivo em inovação.
O fato da DeepSeek ter alcançado a mesma eficiência e funcionalidade que os modelos de IA mais avançados do mercado, como o ChatGPT [da OpenAI], através de inovações em métodos de treino e código fez cair completamente por terra a ideia criada pelas empresas tecnológicas dos EUA de que é preciso ter chips e poder de computação suficientes para desenvolver um modelo de IA suficientemente bom, argumenta Zhuang.
A empresa teria utilizado cerca de 2 mil chips H800 da Nvidia, que não são os mais avançados. A comercialização dos chips mais recentes desenvolvidos pela Nvidia foi proibida na leva de sanções dos EUA à China de outubro de 2022.
Parte do impacto também está na gratuidade da ferramenta chinesa. O ChatGPT do OpenAI tem uma versão gratuita e outras com assinaturas mensais que variam entre 20 e 30 dólares (entre R$ 115 e R$ 172), e uma recente lançada em dezembro, de 200 dólares (R$ 1.150) por mês.
A ferramenta Gemini do Google tem versões que também custam cerca de 20 dólares. A ferramenta da Meta, tem uma precificação por "token", que são unidades ou blocos nos LLM. Os LLM são modelos que conseguem gerar e interpretar a linguagem humana treinados com uma quantidade enorme de dados. Os tokens podem ser palavras, pontuações, etc.
"Pessoas como Sam Altman [diretor do OpenAI] criaram uma forma de pensar sobre a direção do desenvolvimento da Inteligência Artificial (IA), que é baseada no lucro", diz Zhuang Fei.
Isto vai fazer com que empresas como a de Altman ou outras grandes empresas tecnológicas se tornem muito cautelosas em relação às cobranças ao lançarem os seus próprios produtos de IA no futuro. Pelo menos não ousarão usar preços muito altos para lançar os seus próprios serviços de IA, opina o especialista chinês.
Reação no Norte Global ao DeepSeek
Em seguida ao lançamento da ferramenta chinesa, alguns países, em sua maioria do Norte Global (Estados Unidos, Itália, Austrália, Coreia do Sul), começaram a banir ou restringir o acesso a ela. O argumento é que o DeepSeek representaria um risco à segurança nacional dos países.
O Representante Permanente da China na ONU, Fu Cong, rejeitou as insinuações na semana passada numa conferência de imprensa na Sede das Nações Unidas em Nova Iorque, no início da presidência chinesa do Conselho de Segurança.
"A contenção tecnológica e a restrição tecnológica não funcionam. Acredito que esta é uma lição que o mundo inteiro deveria aprender, em particular os EUA. Já disse isto antes, e volto a dizer: Nunca, nunca subestime o engenho dos cientistas e engenheiros chineses", disse Fu Cong.
Zhuang Fei considera a reação dos países do Norte Global "triste e ridícula". "O ridículo é que o DeepSeek é completamente de código aberto, além de ser de código aberto, ele foi lançado com um documento com instruções detalhadas sobre as otimizações e o que o DeepSeek fez nos dados de treino", explica Zhuang. "Um programador brasileiro ou indiano pode mover o DeepSeek para o seu servidor local e depois modificá-lo, ajustá-lo e depurá-lo, e transformá-lo completamente numa ferramenta ajustada para as suas necessidades".
Também foram feitas acusações de que a DeepSeek teria utilizado modelos de IA da OpenAI para desenvolver suas ferramentas. Sobre isso, Zhuang Fei responde que quase nenhum dos funcionários da empresa chinesa estudou no exterior ou trabalhou no Vale do Silício. "Quase toda a sua equipe de cerca de 150 pessoas se formou em universidades chinesas locais e se juntou à DeepSeek. Em outras palavras, tem pouco a ver com os Estados Unidos", conclui.
Edição: Leandro Melito
