OpenAI 发布医疗 AI 评估基准 HealthBench
2025-05-13 10:14
收藏
分享到

Foresight News 消息,OpenAI 发布医疗 AI 评估基准 HealthBench,并已在 GitHub 开源。该基准由来自全球 250 多名医生共同开发,包含 5000 个真实健康对话,旨在评估大语言模型在医疗场景的表现。

推荐阅读
undefined 数字黄金、未来支付、投机之选?比特币的「叙事」在「信仰巅峰」逐个崩塌
赋予比特币引力的故事——数字黄金、自由货币、投机功能正在同时瓦解,代币化、区块链驱动的衍生品和跨境稳定币支付正在成为可信的用例,而这些都不需要比特币参与。
2026-02-22 11:16
以史为鉴,普通投资者如何度过加密寒冬?
做好规划,让自己的投资资金随着认知而变化。
2026-02-22 10:44
Claude 推出预览版 Code Security,可扫描代码库中的安全漏洞并提供针对性建议
Foresight News 消息,Claude 发文表示,网络版 Claude Code 中内置的一项新功能——Claude 代码安全(Code Security),现已推出有限研究预览版。该功能可扫描代码库中的安全漏洞,并针对人类审核提出有针对性的软件补丁建议,使团队能够发现并修复传统方法常常遗漏的安全问题。并针对人类审核提出有针对性的软件补丁建议,使团队能够发现并修复传统方法常常遗漏的安全问题。 [查看更多]
快讯 2026-02-22 09:43

日历

2 月 22 日
查看更多
数据请求中