A moeda do mundo informou em 29 de julho que a Zhīpǔ AI lançou oficialmente a série de modelos flagship GLM-4.5, incluindo as versões GLM-4.5 e GLM-4.5-Air. Dentre eles, o GLM-4.5 possui um total de 355 bilhões de parâmetros, com 32 bilhões de parâmetros ativados; o GLM-4.5-Air tem um total de 106 bilhões de parâmetros, com 12 bilhões de parâmetros ativados, ambos utilizando uma arquitetura de especialistas mistos, suportando uma janela de contexto de 128K. O novo modelo obteve a segunda melhor pontuação global e a primeira entre os nacionais em uma média combinada de 12 testes de referência, conseguindo a fusão nativa de capacidades de raciocínio, codificação e agentes pela primeira vez. O preço da chamada API começa em 0,8 yuan/um milhão de tokens para entrada e 2 yuan/um milhão de tokens para saída, com a versão de alta velocidade gerando mais de 100 tokens/segundo.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
A智谱 AI lançou a série de modelos flagship GLM-4.5
A moeda do mundo informou em 29 de julho que a Zhīpǔ AI lançou oficialmente a série de modelos flagship GLM-4.5, incluindo as versões GLM-4.5 e GLM-4.5-Air. Dentre eles, o GLM-4.5 possui um total de 355 bilhões de parâmetros, com 32 bilhões de parâmetros ativados; o GLM-4.5-Air tem um total de 106 bilhões de parâmetros, com 12 bilhões de parâmetros ativados, ambos utilizando uma arquitetura de especialistas mistos, suportando uma janela de contexto de 128K. O novo modelo obteve a segunda melhor pontuação global e a primeira entre os nacionais em uma média combinada de 12 testes de referência, conseguindo a fusão nativa de capacidades de raciocínio, codificação e agentes pela primeira vez. O preço da chamada API começa em 0,8 yuan/um milhão de tokens para entrada e 2 yuan/um milhão de tokens para saída, com a versão de alta velocidade gerando mais de 100 tokens/segundo.