当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
为什么没有核动力货轮?
你的鱼缸里养过什么奇怪的鱼?
从2025年开始,为什么很多程序员都扔掉了Windows、Mac和Linux,开始拥抱鸿蒙pc了?
如何评价高圆圆的身材算是美女类型的吗?
2025年了,照相机为啥还这么难用?像素低还很贵?
这种情况如何提高打字速度?
小米澎湃OS和华为鸿蒙OS,他们有什么不一样,谁更有发展前途?
Python+rust会是一个强大的组合吗?
有没有GUI框架开发难度小,***消耗又不多,而且又跨平台?
国密加密算法有多安全呢?
前端如何设计网页?
为什么Mac连个正儿八经的CAD都装不了还敢打着生产力的旗号?
鱼缸有没有简单的过滤配置搭配方式?
如果一个人有足够的钱让他一直***,那毒品对他的身体还有害吗?
QQ为什么败给微信?
.NET 应该读“刀NET”还是“点NET”?
新手养鱼,养什么鱼好?
眼睛有飞蚊症可以自愈吗?
大家在做登录功能时,一般怎么做暴力破解防护?
西方人是怎么发现地球是圆的的?
网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?
江西一救护车转运重症患儿 800 公里收 28000 元遭质疑,争议点是什么?哪些信息值得关注?
做个web服务器,gin框架和go-zero怎么选?
如何评价华为最新长焦专利技术?能否颠覆手机长焦摄影的目前限制?
polars到底行不行?
我国004号航母什么时候下水?
Firefox是如何一步一步衰落的?
哪个牌子的护肤品好呀?想给妈妈买一套抗衰老的护肤品?
狗头萝莉究竟做错了什么?
你捡过最大的漏是什么?