英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

西风发自凹非寺 量子位公众号 QbitAI 无情戳穿“长上下文”大模型的虚标现象—— 英伟达新研究发现,包括 GPT-4 在内的 10 个大模型,生成达到 128k 甚至 1M 上下文长度的都有。 但一番考验下来,在新指标“有效上下文”上缩水严重,能达到32K的都不多。 新基准名为RULER,包含检
阅读全文
ICML2024高分!魔改注意力,让小模型能打两倍大的模型

ICML2024高分!魔改注意力,让小模型能打两倍大的模型

彩云科技团队投稿 量子位公众号 QbitAI 改进 Transformer 核心机制注意力,让小模型能打两倍大的模型! ICML 2024 高分论文,彩云科技团队构建 DCFormer 框架,替换 Transformer 核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA)。
阅读全文
加价3000炒相机,社交炫耀与饥饿营销的阳谋

加价3000炒相机,社交炫耀与饥饿营销的阳谋

来源 Tech 星球 文任雪芸 “一个卖家告诉我,现在伊拉克都得加价 300 美元”,最近计划出去旅行的小麦打算在 618 购入一台富士相机,并将型号瞄准了 XT30 二代。 在购买之前,她曾以为这是一天就能完成的事情。“没想到我从线上旗舰店找到了全城的线下经销商,从一手市场找到了二手市场,都没买到
阅读全文
小鹏发布 X9 汽车用户画像:1/3 车主家庭年收入百万

小鹏发布 X9 汽车用户画像:1/3 车主家庭年收入百万

IT 之家 6 月 3 日消息,小鹏汽车在今日发布了 X9 万名用户画像,并称小鹏 X9“销量持续领跑纯电 MPV、纯电三排座车型市场”。 小鹏 X9 的男性车主较多,占比达到了 80%;40 岁以下的车主占到了 66%,仅有 16% 的车主年龄超过 45 岁;超过一半的车主家庭人口为 4-5 人,
阅读全文
曝理想销售部门大调整!

曝理想销售部门大调整!

电动知家消息,据新浪科技报道,为了更多的卖车,理想汽车理想将零售与交付部门合并,并下设了更细分的岗位。自 4 月初开始,理想开启矩阵型组织升级 2.0 版本,多个部门组织架构进行调整。理想汽车的一系列动作都指向一个目标:多卖车!不过,目前,理想汽车针对零售、交付部门合并一事,还未发布相关说明。 报道
阅读全文
OpenAI把GPT-4原始版给了他们:研究不微调只靠提示词能走多远

OpenAI把GPT-4原始版给了他们:研究不微调只靠提示词能走多远

梦晨发自凹非寺 量子位公众号 QbitAI 除了 OpenAI 自己,居然还有别人能用上 GPT-4-Base 版?? 也就是未经微调的预训练版,还不会对话聊天,只会补全句子的模型。 EPFL(瑞士洛桑联邦理工)团队申请到了访问权限,用于研究“上下文学习足以让大模型跟随指令吗?”。 也就是不用监督微
阅读全文
iPhone 15系列价格突然大跳水 史上最低!

iPhone 15系列价格突然大跳水 史上最低!

6 月 1 日消息,5 月 31 日晚间,京东宣布 618 加大苹果降价幅度,Apple 产品京东自营旗舰店 iPhone15 Pro Max 最高优惠 2350 元,iPhone15 Pro 直降 2000 元起。6 月 1 日至 3 日,降价后,iPhone 15 Pro 售价 5949 元;i
阅读全文
王妈短剧18亿播放被指无播出资质,团队称短视频不算短剧

王妈短剧18亿播放被指无播出资质,团队称短视频不算短剧

近日,总在手机短剧中替职场人伸张正义的“王妈”被持续关注。这部以“保姆王妈”为主演的短剧,拥有统一片名和固定的演员角色。自 3 月 5 日上线以来连载 20 集,进入了短视频平台短剧单元,获得了 18.7 亿的爆款播放量。按照国家关于国产网络剧片发行许可相关规定,2023 年 6 月 1 日后上线播
阅读全文
天涯“断臂求生”欲800万元出售域名?创始人回应

天涯“断臂求生”欲800万元出售域名?创始人回应

近日,天涯社区欲以 800 万元出售旗下海南域名 hainan.com,公开向市场寻求买家筹资自救,引发关注。对此,天涯社区创始人、董事长邢明回应称,“天涯仍面临电信数据被卸载的急迫压力,保证其完整性是我们的底线,如果数据真的被卸载,我可能也算是罪人。所以,低价出售这一核心资产是不得已的做法,也算是
阅读全文
微信消费贷产品“分付”北京地区放量,日利率0.04%

微信消费贷产品“分付”北京地区放量,日利率0.04%

6 月 2 日消息,微信消费信贷产品“分付”正扩大北京地区的放量灰测。这是腾讯灰测时间最长的产品,2020 年试水时仅开放给三四线城市和下沉市场,据悉分付“一直以来放量比较谨慎,特别是一线地区”。从一些北京用户处得知,近三四天逐渐被灰测到,在微信“钱包”下收到红点提示“分付”上线,可用额度 8700
阅读全文
俞敏洪称在线买东西很内疚,因为包装会很浪费

俞敏洪称在线买东西很内疚,因为包装会很浪费

近日,物美集团创始人张文中,与新东方创始人俞敏洪畅谈经济发展和创业历程。俞敏洪表示,虽然经常在线上买东西,但内心有点愧疚。他说:“在线上买其实是内疚的,因为任何线上买的东西它都要包装以后才寄过来,那个包装就变成了浪费,不管是纸包装,尤其是泡沫塑料包装的话,我每次收到都会产生内疚。所以我跟家里人都说如
阅读全文
阿里董事长蔡崇信:训练AI模型就像教育孩子,学习三四年就能赶超人类博士

阿里董事长蔡崇信:训练AI模型就像教育孩子,学习三四年就能赶超人类博士

6 月 2 日消息,阿里巴巴集团的董事长蔡崇信,在最新一次对话中,对人工智能的快速发展和未来前景进行了深入的阐述。他将训练 AI 模型的过程比喻为教育孩子,大语言模型的发展竞赛,就像家长展示自己孩子的学术成就一样。尽管培养一个孩子需要 22 年时间,但 AI 在三四年内就能在知识和某些数学计算方面达
阅读全文
抖音重点打击泄露隐私、P图公开辱骂等网暴言论

抖音重点打击泄露隐私、P图公开辱骂等网暴言论

6 月 3 日消息,近日,抖音发布“重点打击泄露隐私、P图公开辱骂等网络暴力言论的公告”,2024 年至今,平台共发现并处置网暴舆情 162 件,拦截超过 5000 万条评论信息,发文警示、教育施暴者近 70 万个,并与公安机关建立网络暴力线索反馈机制,可第一时间把涉嫌违法犯罪的网暴线索报送至公安机
阅读全文
意外!老黄剧透下一代GPU芯片,新演讲又把摩尔定律按在地上摩擦

意外!老黄剧透下一代GPU芯片,新演讲又把摩尔定律按在地上摩擦

白交衡宇发自凹非寺 量子位公众号 QbitAI 刚刚,中国台湾大学体育场,欢呼阵阵如同演唱会,但这次“摇滚巨星”,其实是英伟达创始人黄仁勋,再次回到学校,带来 Computex 重磅演讲,以及英伟达的新一代 GPU。 是的,英伟达新架构 Blackwell 宣布不过 3 个月,老黄就把后三代路线图全
阅读全文
价格战愈演愈烈,新能源车卷不动了!多位车圈大佬喊话:卷价值,不卷价格

价格战愈演愈烈,新能源车卷不动了!多位车圈大佬喊话:卷价值,不卷价格

本报(chinatimes.net.cn)记者张智见习记者黄敏璇深圳摄影报道 “大家不要在小问题上卷了,没有价值!”小米集团创始人、董事长兼 CEO 雷军现场呼吁。 华为常务董事、智能汽车解决方案 BU 董事长余承东则表态:“要卷价值而不是卷价格!卷智能化、自动化,卷安全、高质量,卷卓越的、舒享的用
阅读全文
华为卖车的最大一道坎,就要来了

华为卖车的最大一道坎,就要来了

出品丨虎嗅汽车组 作者丨周到 头图丨视觉中国 许久未见的余承东,如今似乎只会因为华为的新车而亮相了。 5 月 31 日,由华为提供技术和产品赋能的技术生态联盟——鸿蒙智行,旗下的两款新车——问界新 M7 Ultra 和享界 S9 举行了发布会。其中,前者是正式上市并在 6 月 2 日开启交付,而后者
阅读全文
有钱一起赚?闹僵8年之后,马斯克与这位华尔街大佬缓和关系

有钱一起赚?闹僵8年之后,马斯克与这位华尔街大佬缓和关系

6 月 3 日消息,埃隆·马斯克(Elon Musk)和摩根大通(小摩)CEO 杰米·戴蒙(Jamie Dimon)素来不和。但最近马斯克在摩根大通举办的科技峰会上发表讲话,二人关系开始有了和解的迹象,也为公司之间再次合作打开了大门。以下为翻译内容: 经过多年的纠纷,马斯克和杰米·戴蒙在摩根大通的一
阅读全文
刘强东需要反思:帅以正,孰敢不正

刘强东需要反思:帅以正,孰敢不正

导语:“帅以正,孰敢不正”。要想改变京东内部日益严重的管理问题,当务之急的是刘强东需要先保持自律,将自己的大部分精力放在国内,放在京东的业务现场,而非长期身居海外,遥控指挥。 砺石作者 砺石商业评论出品 最近,关于京东集团创始人刘强东的一段短视频在网络上传播甚广,引起巨大争议。 在视频中,刘强东表示
阅读全文