Instructions to use openbmb/AgentCPM-Report with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use openbmb/AgentCPM-Report with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="openbmb/AgentCPM-Report", trust_remote_code=True)
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoModel
model = AutoModel.from_pretrained("openbmb/AgentCPM-Report", trust_remote_code=True, dtype="auto")

Notebooks
Google Colab
Kaggle
Local Apps Settings

vLLM

How to use openbmb/AgentCPM-Report with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "openbmb/AgentCPM-Report"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "openbmb/AgentCPM-Report",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/openbmb/AgentCPM-Report

SGLang

How to use openbmb/AgentCPM-Report with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "openbmb/AgentCPM-Report" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "openbmb/AgentCPM-Report",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "openbmb/AgentCPM-Report" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "openbmb/AgentCPM-Report",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use openbmb/AgentCPM-Report with Docker Model Runner:
```
docker model run hf.co/openbmb/AgentCPM-Report
```

Kaguya-19 commited on Feb 11

Commit

c6232d6

verified ·

1 Parent(s): 744cc1a

Update README.md

Browse files

Files changed (1) hide show

README.md +261 -1

README.md CHANGED Viewed

@@ -81,11 +81,271 @@ You can read more tutorials about AgentCPM-Report in the [documentation](https:/
 ## Evaluation
-Experiments on DeepResearch Bench, DeepConsult, and DeepResearch Gym demonstrate that AgentCPM-Report outperforms leading closed-source systems, with substantial gains in Insight. Detailed benchmark results can be found in the associated research paper.
 ## Acknowledgements
 This project would not be possible without the support and contributions of the open-source community. During development, we referred to and used multiple excellent open-source frameworks, models, and data resources, including [verl](https://github.com/volcengine/verl), [UltraRAG](https://github.com/OpenBMB/UltraRAG), [MiniCPM4.1](https://github.com/OpenBMB/MiniCPM), and [SurveyGo](https://surveygo.modelbest.cn/).
 ## Citation
 If **AgentCPM-Report** is helpful for your research, please cite it as follows:

 ## Evaluation
+<table align="center">
+  <thead>
+    <tr>
+      <th align="center">DeepResearch Bench</th>
+      <th align="center">Overall</th>
+      <th align="center">Comprehensiveness</th>
+      <th align="center">Insight</th>
+      <th align="center">Instruction Following</th>
+      <th align="center">Readability</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <td align="center">Doubao-research</td>
+      <td align="center">44.34</td>
+      <td align="center">44.84</td>
+      <td align="center">40.56</td>
+      <td align="center">47.95</td>
+      <td align="center">44.69</td>
+    </tr>
+    <tr>
+      <td align="center">Claude-research</td>
+      <td align="center">45.00</td>
+      <td align="center">45.34</td>
+      <td align="center">42.79</td>
+      <td align="center">47.58</td>
+      <td align="center">44.66</td>
+    </tr>
+    <tr>
+      <td align="center">OpenAI-deepresearch</td>
+      <td align="center">46.45</td>
+      <td align="center">46.46</td>
+      <td align="center">43.73</td>
+      <td align="center">49.39</td>
+      <td align="center">47.22</td>
+    </tr>
+    <tr>
+      <td align="center">Gemini-2.5-Pro-deepresearch</td>
+      <td align="center">49.71</td>
+      <td align="center">49.51</td>
+      <td align="center">49.45</td>
+      <td align="center">50.12</td>
+      <td align="center">50.00</td>
+    </tr>
+    <tr>
+      <td align="center">WebWeaver(Qwen3-30B-A3B)</td>
+      <td align="center">46.77</td>
+      <td align="center">45.15</td>
+      <td align="center">45.78</td>
+      <td align="center">49.21</td>
+      <td align="center">47.34</td>
+    </tr>
+    <tr>
+      <td align="center">WebWeaver(Claude-Sonnet-4)</td>
+      <td align="center">50.58</td>
+      <td align="center">51.45</td>
+      <td align="center">50.02</td>
+      <td align="center">50.81</td>
+      <td align="center">49.79</td>
+    </tr>
+    <tr>
+      <td align="center">Enterprise-DR(Gemini-2.5-Pro)</td>
+      <td align="center">49.86</td>
+      <td align="center">49.01</td>
+      <td align="center">50.28</td>
+      <td align="center">50.03</td>
+      <td align="center">49.98</td>
+    </tr>
+    <tr>
+      <td align="center">RhinoInsigh(Gemini-2.5-Pro)</td>
+      <td align="center">50.92</td>
+      <td align="center">50.51</td>
+      <td align="center">51.45</td>
+      <td align="center">51.72</td>
+      <td align="center">50.00</td>
+    </tr>
+    <tr>
+      <td align="center">AgentCPM-Report</td>
+      <td align="center">50.11</td>
+      <td align="center">50.54</td>
+      <td align="center">52.64</td>
+      <td align="center">48.87</td>
+      <td align="center">44.17</td>
+    </tr>
+  </tbody>
+</table>
+<table align="center">
+  <thead>
+    <tr>
+      <th align="center">DeepResearch Gym</th>
+      <th align="center">Avg.</th>
+      <th align="center">Clarity</th>
+      <th align="center">Depth</th>
+      <th align="center">Balance</th>
+      <th align="center">Breadth</th>
+      <th align="center">Support</th>
+      <th align="center">Insightfulness</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <td align="center">Doubao-research</td>
+      <td align="center">84.46</td>
+      <td align="center">68.85</td>
+      <td align="center">93.12</td>
+      <td align="center">83.96</td>
+      <td align="center">93.33</td>
+      <td align="center">84.38</td>
+      <td align="center">83.12</td>
+    </tr>
+    <tr>
+      <td align="center">Claude-research</td>
+      <td align="center">80.25</td>
+      <td align="center">86.67</td>
+      <td align="center">96.88</td>
+      <td align="center">84.41</td>
+      <td align="center">96.56</td>
+      <td align="center">26.77</td>
+      <td align="center">90.22</td>
+    </tr>
+    <tr>
+      <td align="center">OpenAI-deepresearch</td>
+      <td align="center">91.27</td>
+      <td align="center">84.90</td>
+      <td align="center">98.10</td>
+      <td align="center">89.80</td>
+      <td align="center">97.40</td>
+      <td align="center">88.40</td>
+      <td align="center">89.00</td>
+    </tr>
+    <tr>
+      <td align="center">Gemini-2.5-pro-deepresearch</td>
+      <td align="center">96.02</td>
+      <td align="center">90.71</td>
+      <td align="center">99.90</td>
+      <td align="center">93.37</td>
+      <td align="center">99.69</td>
+      <td align="center">95.00</td>
+      <td align="center">97.45</td>
+    </tr>
+    <tr>
+      <td align="center">WebWeaver (Qwen3-30b-a3b)</td>
+      <td align="center">77.27</td>
+      <td align="center">71.88</td>
+      <td align="center">85.51</td>
+      <td align="center">75.80</td>
+      <td align="center">84.78</td>
+      <td align="center">63.77</td>
+      <td align="center">81.88</td>
+    </tr>
+    <tr>
+      <td align="center">WebWeaver (Claude-sonnet-4)</td>
+      <td align="center">96.77</td>
+      <td align="center">90.50</td>
+      <td align="center">99.87</td>
+      <td align="center">94.30</td>
+      <td align="center">100.00</td>
+      <td align="center">98.73</td>
+      <td align="center">97.22</td>
+    </tr>
+    <tr>
+      <td align="center">AgentCPM-Report</td>
+      <td align="center">98.48</td>
+      <td align="center">95.10</td>
+      <td align="center">100.00</td>
+      <td align="center">98.50</td>
+      <td align="center">100.00</td>
+      <td align="center">97.30</td>
+      <td align="center">100.00</td>
+    </tr>
+  </tbody>
+</table>
+<table align="center">
+  <thead>
+    <tr>
+      <th align="center">DeepConsult</th>
+      <th align="center">Avg.</th>
+      <th align="center">Win</th>
+      <th align="center">Tie</th>
+      <th align="center">Lose</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr>
+      <td align="center">Doubao-research</td>
+      <td align="center">5.42</td>
+      <td align="center">29.95</td>
+      <td align="center">40.35</td>
+      <td align="center">29.70</td>
+    </tr>
+    <tr>
+      <td align="center">Claude-research</td>
+      <td align="center">4.60</td>
+      <td align="center">25.00</td>
+      <td align="center">38.89</td>
+      <td align="center">36.11</td>
+    </tr>
+    <tr>
+      <td align="center">OpenAI-deepresearch</td>
+      <td align="center">5.00</td>
+      <td align="center">0.00</td>
+      <td align="center">100.00</td>
+      <td align="center">0.00</td>
+    </tr>
+    <tr>
+      <td align="center">Gemini-2.5-Pro-deepresearch</td>
+      <td align="center">6.70</td>
+      <td align="center">61.27</td>
+      <td align="center">31.13</td>
+      <td align="center">7.60</td>
+    </tr>
+    <tr>
+      <td align="center">WebWeaver(Qwen3-30B-A3B)</td>
+      <td align="center">4.57</td>
+      <td align="center">28.65</td>
+      <td align="center">34.90</td>
+      <td align="center">36.46</td>
+    </tr>
+    <tr>
+      <td align="center">WebWeaver(Claude-Sonnet-4)</td>
+      <td align="center">6.96</td>
+      <td align="center">66.86</td>
+      <td align="center">10.47</td>
+      <td align="center">22.67</td>
+    </tr>
+    <tr>
+      <td align="center">Enterprise-DR(Gemini-2.5-Pro)</td>
+      <td align="center">6.82</td>
+      <td align="center">71.57</td>
+      <td align="center">19.12</td>
+      <td align="center">9.31</td>
+    </tr>
+    <tr>
+      <td align="center">RhinoInsigh(Gemini-2.5-Pro)</td>
+      <td align="center">6.82</td>
+      <td align="center">68.51</td>
+      <td align="center">11.02</td>
+      <td align="center">20.47</td>
+    </tr>
+    <tr>
+      <td align="center">AgentCPM-Report</td>
+      <td align="center">6.60</td>
+      <td align="center">57.60</td>
+      <td align="center">13.73</td>
+      <td align="center">28.68</td>
+    </tr>
+  </tbody>
+</table>
+Our evaluation datasets include DeepResearch Bench, DeepConsult, and DeepResearch Gym. The writing-time knowledge base includes about 2.7 million [Arxiv papers](https://www.kaggle.com/api/v1/datasets/download/Cornell-University/arxiv) and about 200,000 internal webpage summaries.
 ## Acknowledgements
 This project would not be possible without the support and contributions of the open-source community. During development, we referred to and used multiple excellent open-source frameworks, models, and data resources, including [verl](https://github.com/volcengine/verl), [UltraRAG](https://github.com/OpenBMB/UltraRAG), [MiniCPM4.1](https://github.com/OpenBMB/MiniCPM), and [SurveyGo](https://surveygo.modelbest.cn/).
+## Contributions
+Project leads: Yishan Li, Wentong Chen
+Contributors: Yishan Li, Wentong Chen, Yukun Yan, Mingwei Li, Sen Mei, Xiaorong Wang, Kunpeng Liu, Xin Cong, Shuo Wang, Zhong Zhang, Yaxi Lu, Zhenghao Liu, Yankai Lin, Zhiyuan Liu, Maosong Sun
+Advisors: Yukun Yan, Yankai Lin, Zhiyuan Liu, Maosong Sun
 ## Citation
 If **AgentCPM-Report** is helpful for your research, please cite it as follows: