issue/341 - support internlm3 model#342

Merged

wooway777 merged 1 commit intoInfiniTensor:mainfrom

rubik-hua:issue/341

May 6, 2026

rubik-hua commented Apr 30, 2026 •

edited

Loading

增加internlm3 model适配

test_infer.py执行截图

服务启动参数如下：
python python/infinilm/server/inference_server.py --device nvidia --model=/data/rubik/models/internlm3-8b-instruct/ --max-new-tokens=100 --max-batch-size=32 --tp=1 --temperature=1.0 --top-p=0.8 --top-k=1 --enable-paged-attn --cache-type=paged --enable-graph --attn=flash-attn
启动截图：

benchmark客户端输出截图如下：

rubik-hua requested a review from a team

April 30, 2026 17:14

pengcheng888 reviewed

View reviewed changes

csrc/config/config_factory.cpp Outdated

pengcheng888 reviewed

View reviewed changes

csrc/engine/rank_worker.cpp Outdated

pengcheng888 reviewed

View reviewed changes

csrc/models/internlm3/internlm3_for_causal_lm.hpp

pengcheng888 reviewed

View reviewed changes

csrc/models/internlm3/internlm3_for_causal_lm.cpp Outdated

pengcheng888 reviewed

View reviewed changes

Collaborator

pengcheng888 left a comment

(1) 请修改代码，然后重新给出测试截图；(2) 请补充服务的测试截图

pengcheng888 reviewed

View reviewed changes

csrc/models/internlm3/internlm3_for_causal_lm.cpp Outdated

pengcheng888 linked an issue

that may be closed by this pull request

[DEV]增加internlm3模型支持 #341

Closed

Collaborator

wooway777 commented May 6, 2026 •

edited

Loading

(1) 请修改代码，然后重新给出测试截图；(2) 请补充服务的测试截图

pengcheng888 reviewed

View reviewed changes

csrc/config/model_config.cpp

pengcheng888 reviewed

View reviewed changes

Collaborator

pengcheng888 left a comment

该pr将会合并到main分支。建议先把两个commit信息压缩成一个，重新push。


          issue/341 - support internlm3 model

c91fac2

rubik-hua force-pushed the issue/341 branch from 6084659 to c91fac2 Compare

May 6, 2026 09:43

pengcheng888 requested a review from wooway777

May 6, 2026 09:46

pengcheng888 approved these changes

View reviewed changes

wooway777 merged commit 064f226 into InfiniTensor:main

Collaborator

wooway777 commented May 6, 2026

多谢老师

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet