在本周的谷歌年度開發者大會I/O上,谷歌宣布了雙子座家庭的新成員——Gemini 1.5 Flash,一款專為速度和效率優化的新型人工智能模型。該模型不僅擴展了谷歌在人工智能領域的邊界,還進一步滿足了開發人員對更輕、更便宜但功能強大的AI機型的需求。
谷歌DeepMind首席執行官戴密斯·哈薩比斯在報告中指出,Gemini 1.5 Flash在多個領域表現出色,包括摘要生成、聊天應用、圖像和視頻字幕制作,以及從長文檔和表格中提取數據等。這款新型AI模型之所以能夠在保持功能強大的同時實現輕量級設計,得益于一種名為“蒸餾”的過程,該過程將Gemini 1.5 Pro中最重要的知識和技能轉移到較小的模型中。
盡管Gemini 1.5 Flash的重量較輕,但它卻擁有與Pro版相同的多模態功能,包括一個能夠處理100萬個令牌的長上下文窗口。這一能力使得該模型能夠一次性分析高達1500頁的文檔或超過30000行的代碼庫,為開發人員提供了前所未有的便利。
值得注意的是,Gemini 1.5 Flash并非面向普通消費者,而是專為開發人員設計。通過使用谷歌的技術,開發人員能夠更快速、更經濟地構建自己的人工智能產品和服務。
此外,谷歌還對Gemini 1.5 Pro進行了升級,增強了模型編寫代碼、推理以及解析音頻和圖像的能力。更令人興奮的是,谷歌計劃在今年晚些時候將現有模型的上下文窗口增加一倍,達到驚人的200萬個令牌。這將使模型能夠同時處理長達2小時的視頻、22小時的音頻、6萬多行代碼或超過140萬個單詞的內容。
目前,Gemini 1.5 Flash和Pro版本均已在谷歌的AI Studio和Vertex AI中提供公開預覽。同時,谷歌還發布了Gemma open模型的新版本——Gemma 2。然而,這些更新主要面向開發人員和對構建AI應用感興趣的用戶,對于普通消費者來說,這些功能可能并不直接相關。
隨著Gemini 1.5 Flash的發布,谷歌再次展示了其在人工智能領域的創新實力,并為開發人員提供了更多強大而靈活的工具來構建未來的人工智能產品和服務。
原創文章,作者:Google,如若轉載,請注明出處:http://www.doinggoodmedia.com/article/654265.html