哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌聲稱Gemini超越GPT-4,你有何看法呢?

人工智能與大數(shù)據(jù)技術(shù) ? 來源:CSDN ? 2023-12-14 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

誰能想到,一夜之間,人們對于谷歌 Gemini 的看法竟發(fā)生了 180° 轉(zhuǎn)變。

昨天,谷歌在 X 上展示 Gemini 原生多模態(tài)能力的 6 分半鐘視頻下,幾乎是清一色的贊揚:

efe279ee-9a21-11ee-8b88-92fbcf53809c.png

eff0c878-9a21-11ee-8b88-92fbcf53809c.png

eff52e90-9a21-11ee-8b88-92fbcf53809c.png

而到了今天,Gemini 還是那個 Gemini,但網(wǎng)友已經(jīng)不買賬了:

f003b7c6-9a21-11ee-8b88-92fbcf53809c.png

f00849f8-9a21-11ee-8b88-92fbcf53809c.png

發(fā)生了什么,才會讓人們的態(tài)度一夜轉(zhuǎn)變?原因在于那個 6 分半的 Gemini 演示視頻:它是假的,是經(jīng)過剪輯的,甚至在被質(zhì)疑后,谷歌還承認(rèn)了!

1、Gemini 的視頻演示效果,是假的

相信看過 Gemini 演示視頻的人,多數(shù)都對它的“多模態(tài)能力”印象深刻。例如,Gemini 看到一只鴨子從草圖到填色的整個過程,可實時給出解釋和反饋,還能在換杯游戲中追蹤紙團、辨別各種手勢、重新排列行星草圖等——短短 6 分半的視頻,Gemini 給人的感覺是:仿佛可以實時觀察周圍世界并及時做出反應(yīng),還能與人類進行流暢的語音對話。

對于 Gemini 如此強大的能力,谷歌給出的解釋是:Gemini 是 AI 的新品種,即“原生多模態(tài)”。

“我們將 Gemini 設(shè)計為原生多模態(tài),從一開始就針對不同模式進行了預(yù)訓(xùn)練。然后我們使用額外的多模態(tài)數(shù)據(jù)對其進行微調(diào),以進一步完善其有效性,這有助于 Gemini 從頭開始無縫地理解和推理各種輸入,因此遠(yuǎn)遠(yuǎn)優(yōu)于現(xiàn)有的多模式模型。此外,Gemini 的多模態(tài)功能幾乎在每個領(lǐng)域都是最先進的?!?/p>

聽起來似乎有理有據(jù),于是當(dāng)一眾網(wǎng)友都沉浸于 Gemini 的強大、好奇它能否真正超越 GPT-4 的時候,彭博社作家 Parmy Olsen 突然發(fā)出了一個“不太和諧”的聲音:Gemini 的視頻演示效果,是假的。

一石激起千層浪!好在 Parmy Olsen 并沒有吊人胃口,很干脆地將谷歌的作假手法和證據(jù)全部公開:Gemini 并不能像視頻中那樣實時語音回答——它看到的只是視頻片段中的靜態(tài)圖像,其語音也只是在讀出人類給它的文本提示,且響應(yīng)時間比視頻中展示的要長。

2、背后的人工提示過程,全部省略

舉個例子,Gemini 演示視頻中有一段識別動態(tài)手勢的片段:通過觀察左邊不斷變化的手勢,Gemini 回答道,“我知道你在干嘛!你在玩石頭剪刀布!”

這段視頻乍看之下,你是不是以為可以實時向 Gemini 展示不同的東西,并與它交流?但事實并非如此:Gemini 僅支持文本交流,并不能進行語音對話。

根據(jù)谷歌公布的文檔內(nèi)容顯示,這段視頻顯然是經(jīng)過“加工”的:

(1)先給 Gemini 陸續(xù)展示三張單個手勢的圖片,問它分別看到了什么;

(2)再把三張手勢圖片一起發(fā)給 Gemini,問它這是在干什么,并提示是一個“游戲”;

(3)通過以上一步步的提示和引導(dǎo),Gemini 最終給出了答案:你在玩石頭剪刀布。

針對以上步驟,一位谷歌發(fā)言人解釋道:“為了測試 Gemini 在各種挑戰(zhàn)中的能力,我們通過捕捉錄像來制作演示。然后我們使用錄像中的靜態(tài)圖像幀提示 Gemini,并通過文本進行提示?!?/p>

Parmy Olsen 將其簡單翻譯了一下:“谷歌拍下了那雙手做很多事情的畫面,然后一張一張地向 Gemini 展示了這些鏡頭的照片。所以根本沒有語音對話,而是跟 ChatGPT 和 Bard 一樣的文本交流?!?/p>

此外,谷歌發(fā)言人還補充稱,用戶的配音都是從實際提示中摘錄的真實內(nèi)容,用于生成隨后的Gemini輸出結(jié)果——對此,Parmy Olsen 的翻譯是:“你在視頻中聽到的聲音,只是在朗讀文字提示?!?/p>

也就是說,谷歌所展示的 Gemini 演示視頻,是省略了所有引導(dǎo)提示、跳過了等待響應(yīng)的時間、并用配音合成的最終結(jié)果。

3、都是真實的,只是“為了簡潔”剪輯視頻

當(dāng)然,Gemini 可能也真的做到了在視頻中展示的所有事情,但這兩種表現(xiàn)形式完全不同:

以文字形式,通過人工提示分步驟直接展示其多模態(tài)效果,對于 Gemini 的能力沒有過多修飾;

以視頻形式,經(jīng)過剪輯、省略其背后大量引導(dǎo)過程的視頻來呈現(xiàn),極大暗示了 Gemini 的實時高效。

由于 Parmy Olsen 的曝光,網(wǎng)友對于 Gemini 的態(tài)度瞬間改變,并發(fā)出了無數(shù)質(zhì)疑。而對于被質(zhì)疑造假的這個視頻,谷歌 DeepMind 研究副總裁 Oriol Vinyals 今天給出了回應(yīng):

“視頻中的所有用戶提示和輸出都是真實的,只是為了簡潔起見進行了縮短。該視頻展示了使用 Gemini 構(gòu)建的多模態(tài)用戶體驗可能是什么樣子,我們制作該視頻是為了激發(fā)開發(fā)人員的靈感?!?/p>

換句話說,Oriol Vinyals 承認(rèn) Gemini 演示視頻經(jīng)過了剪輯,原因是“為了簡潔”。不論其剪輯初衷是否真的只是為了“簡潔”,但不得不說:在谷歌沒明確說明視頻經(jīng)過剪輯之前,多數(shù)人對于 Gemini 的速度、準(zhǔn)確性以及與交互的基本模式,都產(chǎn)生了誤解。

如果在這個視頻開頭,谷歌就說“這是我們研究人員測試過的 Gemini 交互的理想化表現(xiàn)”,那網(wǎng)友就會有心理預(yù)期:哦,那這個視頻一半是現(xiàn)實,一半是理想化——但事實上,該視頻的開頭是,“本視頻重點介紹了我們與 Gemini 的一些有趣互動”,因此人們很難意識到這個視頻中 Gemini 的表現(xiàn)是經(jīng)過“加工”的。

4、網(wǎng)友:“這就是虛假和誤導(dǎo)”

于是意料之中,Oriol Vinyals 的回應(yīng)并沒有受到網(wǎng)友的理解,其 X 帖子下多是譴責(zé)谷歌虛假、夸大營銷:

“如果你想激勵開發(fā)者,那為什么不發(fā)布真實的內(nèi)容呢?提示不可能既‘真實’又‘縮短’,這就是虛假和誤導(dǎo)?!?/p>

如今的 AI 初創(chuàng)公司,不就是像你們這樣夸張的演示來騙取資金的嗎?

“‘真實,縮短’,真的嗎?只是營銷罷了?!?/p>

另外值得一提的是,還有網(wǎng)友指出,谷歌Gemini 對比GPT-4 的測試基準(zhǔn)也并不相同:“在MMLU測試中,Gemini下面有個灰色小字標(biāo)CoT@32,即使用了思維鏈提示技巧、選取了32次中的最好結(jié)果,GSM8K 的性能也是用 Maj1@32 與 GPT-4 的 5-Shot CoT 進行對比的?!?/p>

f02f184e-9a21-11ee-8b88-92fbcf53809c.png

那么對于谷歌聲稱Gemini 超越GPT-4 的說法,你又有何看法呢?

本文轉(zhuǎn)自公眾號“CSDN”,ID:CSDNnews







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6257

    瀏覽量

    111949
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    371

    瀏覽量

    16959
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1600

    瀏覽量

    10391

原文標(biāo)題:Gemini 超越 GPT-4 靠作弊?谷歌承認(rèn):是的,演示視頻經(jīng)過了剪輯

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時代

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)北京時間5月21日,谷歌2025 Google I/O開發(fā)者大會正式召開,從其發(fā)布的新品來看,這可以說是一場AI盛會。 在AI大模型方面,發(fā)布了Gemini 2.5
    的頭像 發(fā)表于 05-22 09:01 ?6787次閱讀
    <b class='flag-5'>谷歌</b>AI霸主歸來!多線反擊OpenAI,開啟安卓<b class='flag-5'>Gemini</b>時代

    Gemini CLI 中轉(zhuǎn)站配置使用教程

    Gemini CLI 中文使用指南 基本介紹 Gemini CLI 是谷歌提供的開源命令行 AI 工具,將 Gemini 的強大功能直接帶入您的終端。它提供輕量級的
    發(fā)表于 02-10 17:29

    晶晨攜手谷歌,助力端側(cè)大模型Gemini的硬件落地

    電子發(fā)燒友網(wǎng)報道 在科技飛速發(fā)展的當(dāng)下,端側(cè)智能技術(shù)正以前所未有的速度滲透到各個領(lǐng)域。1月28日,晶晨股份透露,公司與谷歌有著長達十余年的深度合作基礎(chǔ)。作為谷歌新一代端側(cè)AI硬件(整合Gemini
    的頭像 發(fā)表于 01-29 10:44 ?2374次閱讀

    谷歌正式推出Gemini 3 Flash模型

    我們正式推出了 Gemini 3 Flash,這是以較低成本打造的高效前沿智能,成功地進一步擴展了 Gemini 3 模型系列。
    的頭像 發(fā)表于 01-22 16:04 ?709次閱讀

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協(xié)議,下一代蘋果基礎(chǔ)模型(Apple Foundation Models)將基于谷歌Gemini模型和云技術(shù)。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長期以來,蘋果在AI領(lǐng)域的發(fā)展相對滯后,其語音助手Siri的功能
    的頭像 發(fā)表于 01-13 14:59 ?5851次閱讀

    Gemini AI 再進化:谷歌聯(lián)合XREAL發(fā)布Project Aura, 打開“看見世界”的新能力

    被定位為迄今為止最完整、最接近 Android XR 理想形態(tài)的硬件樣本。作為谷歌官方認(rèn)可的系統(tǒng)級參考硬件,Project Aura 標(biāo)志著 Gemini AI 第一次真正擁有“看見世界”的能力
    發(fā)表于 12-09 11:06 ?1409次閱讀
    <b class='flag-5'>Gemini</b> AI 再進化:<b class='flag-5'>谷歌</b>聯(lián)合XREAL發(fā)布Project Aura, 打開“看見世界”的新能力

    谷歌正式推出最新Gemini 3 AI模型

    今天我們正式推出 Gemini 3,這是我們迄今為止最智能的模型,能夠幫助用戶實現(xiàn)任何創(chuàng)意。Gemini 3 Pro 基于最先進的推理技術(shù),與之前的版本相比,它在所有主要的 AI 基準(zhǔn)測試中都取得了無與倫比的結(jié)果,尤其是在編程方面也超越
    的頭像 發(fā)表于 11-24 11:10 ?1412次閱讀
    <b class='flag-5'>谷歌</b>正式推出最新<b class='flag-5'>Gemini</b> 3 AI模型

    谷歌Gemini 3模型開啟智能新紀(jì)元

    大約兩年前,我們開啟了 Gemini 時代,這是公司迄今為止投入最大的科研和產(chǎn)品項目之一。自那時起,看到大家對它的喜愛程度,著實令人驚嘆?,F(xiàn)在,每月 20 億用戶使用 AI 概覽 (AI
    的頭像 發(fā)表于 11-24 11:07 ?983次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b> 3模型開啟智能新紀(jì)元

    【RA4M2-SENSOR】3、使用GPT定時器-PWM輸出

    GPT介紹 通用 PWM 定時器(GPT,General PWM Timer)是 RA MCU 的其中一種 32/16 位的定時器外設(shè)。 在 GPT 當(dāng)中,可分為 GPT32 和
    發(fā)表于 09-01 15:20

    OpenAI或在周五凌晨發(fā)布GPT-5 OpenAI以低價向美國政府提供ChatGPT

    外界一直在期待的OpenAI新一代大語言模型GPT-5或?qū)l(fā)布。據(jù)外媒的報道,GPT-5很可能在周五凌晨發(fā)布。這是OpenAI在2023年的3月份推出自然語言處理模型GPT-4之后,兩年多時候后最受
    的頭像 發(fā)表于 08-07 14:13 ?1.4w次閱讀

    谷歌推出Gemini 2.5 Pro預(yù)覽版(I/O版本)

    我們目睹了開發(fā)者使用 Gemini 2.5 Pro 取得了令人贊嘆的成就。因此,我們決定提前數(shù)周發(fā)布更新版本,以便開發(fā)者盡早體驗新版模型。
    的頭像 發(fā)表于 06-10 10:43 ?1304次閱讀

    GPT-5即將面市 性能遠(yuǎn)超GPT-4

    行業(yè)芯事
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年06月04日 13:38:23

    谷歌Gemini 2.5模型系列更新

    今年 3 月,我們發(fā)布了迄今為止最智能的模型 Gemini 2.5 Pro,兩周前,我們提前為您帶來了 I/O 更新,以便開發(fā)者構(gòu)建出色的網(wǎng)絡(luò)應(yīng)用。
    的頭像 發(fā)表于 05-23 14:56 ?1344次閱讀

    谷歌I/O 2025大會前透露:Android 16接入Gemini,智能手機、XR設(shè)備升級

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)2025 Google Android I/O將5 月 20 日至 21 日舉行,在這場活動之前,谷歌召開了“The Android Show: I/O Edition
    的頭像 發(fā)表于 05-18 00:03 ?7783次閱讀
    <b class='flag-5'>谷歌</b>I/O 2025大會前透露:Android 16接入<b class='flag-5'>Gemini</b>,智能手機、XR設(shè)備升級

    DeepSeek MoE架構(gòu)下的網(wǎng)絡(luò)負(fù)載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)利用率的關(guān)鍵策略

    近年來,隨著AI大模型訓(xùn)練(如GPT-4、Gemini)的爆發(fā)式增長,數(shù)據(jù)中心網(wǎng)絡(luò)的流量壓力急劇上升。單次訓(xùn)練任務(wù)可能涉及數(shù)千張GPU卡協(xié)同工作,生成集合通信流量(All-Reduce
    的頭像 發(fā)表于 04-28 12:04 ?1014次閱讀
    DeepSeek MoE架構(gòu)下的網(wǎng)絡(luò)負(fù)載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)利用率的關(guān)鍵策略
    德格县| 乐安县| 理塘县| 奇台县| 五家渠市| 廊坊市| 孙吴县| 陈巴尔虎旗| 新化县| 梧州市| 长乐市| 阳原县| 裕民县| 郁南县| 中牟县| 杭锦后旗| 张家口市| 台南市| 永川市| 枣阳市| 万全县| 昆明市| 东山县| 澳门| 广元市| 孟津县| 沙湾县| 谷城县| 沁水县| 施秉县| 七台河市| 银川市| 高邮市| 芒康县| 大安市| 南溪县| 崇文区| 淮滨县| 华亭县| 晋中市| 莲花县|