<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>從RAG到eLAND Active RAGᵀᴹ: 開創知識管理新篇章

精華文章從RAG到eLAND Active RAGᵀᴹ: 開創知識管理新篇章

從RAG到eLAND Active RAGᵀᴹ:開創知識管理新篇章

在數位化時代,資訊量爆炸式增長,如何有效地蒐集、整理、儲存並運用知識,無疑是各企業組織提升競爭力的關鍵之一,良好的知識管理不僅能縮短決策時間,還能提高員工效率、促進創新,以在快速變化的環境中保持彈性與活力。檢索增強生成技術(Retrieval-Augmented Generation, RAG)的出現,為知識管理帶來了全新突破,而透過引入多輪次資料整合與更高效的檢索能力,意藍進而將RAG 技術發展為獨家專門的eLAND Active RAGTM(主動式檢索增強生成技術),大幅提高知識管理的效率與精準度,使各部門單位能更靈活應對多變的市場需求。

本期 AI 知識庫亮點

主動式檢索增強生成技術如何重塑知識管理
  1. 認識eLAND Active RAGᵀᴹ ── 主動式檢索增強生成技術
  2. 導入主動式檢索增強生成技術對知識管理的影響
eLAND Active RAGᵀᴹ 在知識管理中的應用實例

主動式檢索增強生成技術如何重塑知識管理

知識不僅是企業組織日常運營的基礎,更是其持續發展和創造價值的核心驅動力,透過有效的知識管理,能夠累積並共享內部專業知識,進而減少重複性工作,促進跨部門合作、優化決策過程並提高運營效率。然而,傳統的知識管理方法往往面臨資訊分散、無法即時更新及搜尋效率低下等挑戰,使得企業在應對快速變化的業務需求時,可能需投入較多時間和資源以達成目標。

而檢索增強技術的出現,逐步突破了這些障礙,它結合了搜尋引擎快速檢索的優勢與大語言模型的生成能力,在生成答案前先檢索最新的相關資訊,以確保結果更可靠精準。特別是意藍所獨家發展之進階版本——主動式檢索增強生成技術(eLAND Active RAGᵀᴹ),更是在此基礎上實現突破,能針對複雜的問題進行多回合查詢,逐步完善答案,大幅提升知識檢索效率,為知識管理帶來嶄新的轉機。

認識eLAND Active RAGᵀᴹ ── 主動式檢索增強生成技術
eLAND Active RAGᵀᴹ(主動式檢索增強生成)是在RAG(檢索增強生成)的基礎上進一步升級的技術,具備以下核心功能特性,使其在知識管理中更具優勢:
  1. 內外部數據動態整合:
    eLAND Active RAGᵀᴹ 能根據問題性質,自動判斷最佳數據來源,從內部系統、資料庫以及外部網站等多元數據庫中進行查詢,並進行綜合分析,使生成之回覆不再僅依賴過時數據,而是根據最新資料產出精確、全面的結果。
  2. 語義理解與推理:
    與傳統基於靜態關鍵詞的檢索方式不同,eLAND Active RAGᵀᴹ 能夠理解語句的語義,並依據問題的背景進行推理和回應,使結果更相關且精準。例如,對於問題「如何優化員工的工作流程?」,系統會理解問題的核心是提升工作效率,並基於此提供具體的建議,如檢視現有工具的使用情況、引入自動化流程或改善跨部門協作等。
  3. 多回合查詢與自主優化
    eLAND Active RAGᵀᴹ 能根據已獲得之初步資訊動態調整查詢策略,多回合查詢以逐步完善答案,從而實現更深入的問題解決和分析。例如,對於「如何提升某產品市場佔有率?」的提問,在第一輪查詢時先自內部資料中提取產品的銷售數據,提供概括性分析;接著,再根據已取得的結果,進一步從外部資料庫提取相關細節,如競品的市場策略、消費者對產品的反饋等,於後續查詢中補充數據背景或上下文資訊。
導入主動式檢索增強生成技術對知識管理的影響
綜上所述,導入主動式檢索增強生成技術將對知識管理帶來深遠影響,主要體現在以下幾個方面:
  1. 提升數據整合能力,突破資訊孤島
    支援內外部數據的動態整合,能夠從企業內部資料庫、檔案系統到外部網站、公開數據源中提取所需資訊,並進行綜合分析,有效解決了傳統知識管理中數據分散、無法即時更新的難題。
  2. 增強問題理解與回應的精準性
    理解使用者提問的核心意圖,並結合問題背景進行智能推理,提供更精準且相關的答案,大幅提升知識檢索的有效性,避免使用者因模糊或不相關的資訊浪費時間。
  3. 提升知識應用價值
    透過 eLAND Active RAGᵀᴹ,能將分散的資訊轉化為結構化且易於應用的知識,例如生成與決策相關的報告或建議方案,協助企業組織快速識別業務機會或解決問題,抑或縮短內部問題回應時間、提升市場預測準確度,進而實現更高效的資源配置。

eLAND Active RAGᵀᴹ 在知識管理中的應用實例

意藍的新一代生成式AI知識管理系統 AI Search for KM 便結合了 eLAND Active RAGᵀᴹ 以及搜尋引擎、NLP與大語言模型等技術,提供使用者更高效、智能的知識搜尋與問答服務體驗,其應用情境相當多元,對複合型知識任務具備強大處理能力,能夠主動拆解複雜問題並完成知識任務,以下將舉例說明。
當對系統提問「少子女化對社會產生什麼樣的衝擊?」,在 eLAND Active RAGᵀᴹ 的輔助下,系統將依循以下步驟進行運作,確保提供精準且有所依據的回答:

  1. 拆解任務及選用工具

    系統首先分析問題,識別核心關鍵字(如「少子女化」、「社會衝擊」),並將問題拆解為可操作的子任務。接著,系統檢視可用的資料來源,如政策資料庫、最新的媒體報導、少子女化相關的學術研究與報告等,並選定最符合此問題的資料來源作為後續查詢的基礎。

  2. 生成輸入參數

    根據問題內容與選定資料庫,系統會再進一步生成適配的查詢參數,即設定一組適合用來搜尋資料的條件,並以設定之參數為基礎,啟動後續資料檢索過程。例如:

    – 關鍵字:少子女化、社會影響、政策、新聞、研究計畫。
    – 時間範圍:過去1年的相關資料。
    – 查詢格式:結構化的API請求或自然語言查詢。

  3. 解析輸出結果

    接著,系統會對檢索到的資料進行整理與分析,例如自少子女化相關的新聞報導中,統計出過去一年該議題的討論成長率,或是從研究資料中,彙整人口統計變化以及對社會經濟的具體影響點。

  4. 進行判斷及回覆

    最後,系統將檢視目前取得的資訊是否足以回答問題。若資訊足夠,則系統便會根據統計之結果與分析,生成針對使用者提問的回答,如「少子女化對社會的衝擊包括勞動力減少、教育資源分配過剩及老齡化社會負擔增加等。」
    而若判斷資訊仍不足,系統則會重新進行檢索、調整參數(如擴大時間範圍或查詢更多資料庫),最多重複三次,以確保回答的完整性與準確性。

無論是企業組織或公部門單位,在 AI Search for KM 及 eLAND Active RAGᵀᴹ 的助力下,將能夠實現更高效、更精準的資訊處理與應用,發揮知識管理的最大價值。

想進一步了解「新一代生成式AI知識管理系統(AI Search for KM)」?

<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>大語言模型的企業應用策略: 營運效率提升的最佳助手

精華文章大語言模型的企業應用策略: 營運效率提升的最佳助手

大語言模型的企業應用策略:
營運效率提升的最佳助手

大語言模型(Large Language Model,LLM)是生成式AI領域中十分重要的一項技術與應用,它通過大規模文本數據的訓練,學習語言文字中的上下文結構和語意關係,並能生成自然流暢的回應,與使用者的提問做互動。本文將帶您了解大語言模型的原理與特點,探討企業如何有效運用大語言模型、使其在工作場域中發揮價值,並介紹意藍自行研發之大語言模型eLAND GOAT的具體應用。

認識大語言模型

什麼是大語言模型?
大語言模型(Large Language Model,LLM) 是一種基於大量資料訓練而成的深度學習模型,其特色在於模型參數量大、學習訓練資料廣泛,且在模型的訓練過程中,能夠識別及理解大量資料中每個詞句間的上下文關係,以及在語意空間中背後的意義,再根據使用者的提問或指令(Prompt),提供符合邏輯的自然語言回應。大語言模型的運作邏輯就好比文字接龍遊戲──根據使用者所輸入的詞句,模型會基於已學習、訓練過的資料與上下文,來評估哪些字詞最有可能出現在使用者的輸入之後,並生成相對應的文字回應。

 

大語言模型的核心特點?
綜前所述,大型語言模型的核心特點包含以下幾點:
  1. 上下文理解:大型語言模型能更好地理解和處理文意,生成連貫、有邏輯的流暢回應。
  2. 多任務適用:大型語言模型能夠應付多種自然語言處理任務,無需單獨為每種任務設計特定模型,也因此能夠廣泛應用於多種不同場景。
  3. 大數據訓練:大型語言模型通常基於數千萬、甚至數億的文本資料進行訓練,龐大的數據量使得模型掌握了豐富的知識,從而能夠做出更準確的判斷與回覆。
不過也需要注意的是,大語言模型是根據過往數據資料訓練而成的,若遇到訓練資料中缺乏、無法回應的提問、或參考資料本身有所偏誤,可能就會出現AI杜撰、AI幻覺 (Hallucination)等現象,生成出錯誤甚至不存在的回應。

大語言模型的商業應用可能性

企業的大語言模型應用場域
而基於大語言模型具有的核心特點,可以被運用在以下幾個商業場域當中,來協助企業提升營運效率,輔助企業達成不同的目標:
  1. 市場行銷:大語言模型可以生成文案、分析市場趨勢以及顧客偏好,甚至優化廣告投放策略。它可以幫助撰寫社群媒體文章、電子郵件行銷內容,並根據市場數據預測消費者需求。
  2. 內部管理:大語言模型也可以成為內部知識管理的助力,幫助員工快速找到需要的資料,或者自動生成報告、會議記錄。此外,在客戶服務方面,也可以24小時即時回應客戶問題,減少人工客服負擔,並提供可驗證的參考內容出處。
  3. 輔助決策:透過分析企業數據,大語言模型還可以協助管理層做出更準確的市場預測,從而提升整體營運決策的效率和準確性。
 
企業如何善用大語言模型提升營運效率?
那企業究竟又該如何將大語言模型的優勢發揮出來?關鍵在於企業如何對模型下達準確的指令(Prompt)。對大語言模型提問時,語句及用詞要盡可能地具體、包含上下文訊息,才能讓大語言模型提供有效的回應,例如當想了解有關國內知名金融業者新光金控的相關資訊時,應避免簡化問句為「總資產?」,而是「請問新光金在今年第二季結束時的資產總額是多少?」,通過更精確的提問,大語言模型能提供更完整的回應。 除了應避免模糊不清的提問內容,提問的技巧也同樣重要,使用者應逐步引導模型進行推理,如欲詢問「新光金在大陸投資有賺錢嗎?」,可先調整提問為「請問新光金在大陸的投資項目為何?」,根據模型的回應,再進一步提問「投資損益為多少?」;藉由調整指令,讓模型能夠不斷學習並一次性回答多個相關問題,從而提升營運效率。

 

企業導入大語言模型的關鍵要素​
隨著大語言模型的發展愈發成熟,企業導入大語言模型已是時下趨勢。而企業在導入大語言模型時則需考量多個關鍵要素:
  1. 數據隱私與資安控管:對於許多企業來說,使用大語言模型等相關服務時,除了須確保符合相關法律規範外,還需要對數據採取必要的保護,避免數據外洩或資安方面的風險。
  2. 模型與系統的相容性:在導入大語言模型時,需注意模型本身與企業現有系統的相容性,這涉及了技術、成本等多方面的考量,若企業缺乏相關經驗,便會使導入時的成本與難度增加。
  3. 企業基礎部署條件:不同企業在選擇大語言模型時,需根據自身具備的基礎條件,選擇雲端、地端或是混合部署。另外也須有足夠的計算資源與維運人力,確保模型運行並在必要時針對模型進行微調(fine-tune)。

意藍於大語言模型的應用

意藍深知大語言模型對企業營運的重要性與無限可能性,然而因目前主流的大語言模型多是使用英文語料進行訓練,中文語料的佔比相對較低,大部分資料又都是以簡體中文為主,與繁體、台灣所慣用的用字遣詞有一定差距。意藍挑選出台灣常用的語料,在兼顧適法性及合理使用的條件下,整理出AI的學習材料,開發出台灣本土的大語言模型eLAND GOAT,目標讓大語言模型可以更加在地化,並兼顧效能及成本之考量,符合企業特定目的用途。

而意藍在發展出的台灣本土在地化大語言模型eLAND GOAT後,也將其運用在企業知識管理領域中,推出新一代生成式AI知識管理系統-AI Search for KM,不僅提供使用者可以以自然語言的形式進行問答,還結合檢索增強生成(Retrieval-Augmented Generation, RAG)技術,能夠有效地找出精準且相關的內容,藉此提高大語言模型在生成內容的準確性和可靠性,並能夠在每次回應時附上參考內容出處以供驗證,有效避免AI幻覺的可能性。

除此之外,AI Search for KM還可以串接企業知識庫,不需要大量的人力和機器資源重新訓練或微調模型,並且可選擇在雲端、地端或混合部署大語言模型,免除機敏資訊外洩的疑慮的同時,也能快速的從大量的檔案文件中找出所需內容,大幅縮減企業在知識內化的時間成本與負擔,使其能夠更有效地管理和運用知識資源、提升營運效率。

想進一步了解更多意藍AI技術嗎?
<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>生成式AI的簡介與應用

精華文章生成式AI的簡介與應用

生成式AI的簡介與應用

生成式AI是人工智慧技術中一個重要的分支,現已廣泛應用於各行各業,無論是在智能客服、內容創作,或者資料分析中,其都扮演了日益重要的角色;然而,隨著生成式AI的普及,相應的挑戰與危機也浮上檯面。本文將帶您瞭解生成式AI的基本概念及其背後的大語言模型技術,並分析其在發展過程中面臨的痛點與挑戰,最後透過實際案例,展示生成式AI在不同領域中如何實現高效應用。

生成式AI與人工智慧技術簡介

生成式AI是一種人工智慧技術,主要特點是能夠生成新的內容,例如文字、圖像或音訊,不僅限於對現有資料進行分類或預測,還能夠用於解決問題或滿足多樣的需求。而人工智慧技術有很多種類型,常見的包含監督式學習、非監督式學習、增強式學習等,三者處理、學習數據的方式如下:
  1. 監督式學習:我們告訴模型一些範例資料和答案,模型學到資料和答案之間具有鑑別力的特徵後,就可以依樣畫葫蘆去進行分類或預測。
  2. 非監督式學習:給模型一批資料但不告訴它答案,讓模型自己找到資料當中重要的特徵進行分群。
  3. 增強式學習:不給模型訓練資料,但告訴它目標及獎勵機制是什麼(怎麼做會得分、怎麼做會扣分),讓模型自行嘗試找出達到高分的方法。
生成式AI則強調用更大量的資料,在沒有明確標籤或指導下,學習這些資料的分佈,生成更多類似的資料。

生成式AI背後的技術原理:大語言模型

生成式AI所依靠的其中一個技術便是「大型語言模型」(Large Language Model, LLM),其特色在於訓練過程中,模型可以自大量資料中自行學習和理解每個詞、每個句子之間的關係與背後的意義,最後根據指令,提供符合邏輯的自然語言回應。好比文字接龍,參與者需要根據已知的詞語來生成符合規則的新詞語,大型語言模型在接收問題後,會基於訓練數據和上下文,來評估問題背後最高機率會出現的字詞是什麼,然後一字一字生成出來,最終形成完整且符合邏輯的回答。

而相較於傳統的自然語言處理技術,大型語言模型的優勢有三:
  1. 上下文理解:大型語言模型能更好地理解和處理文意,生成的回應更連貫且有邏輯。
  2. 多任務適用:大型語言模型能夠應付多種自然語言處理的任務,不需要單獨為每種任務來設計特定模型,也因此應用更多更廣。
  3. 大規模資料:大型語言模型用以訓練的文本資料通常十分龐大,可能是幾千萬甚至幾億的語料,讓模型能夠掌握豐富的知識,做出更準確的理解與回覆。
這些特點使得大型語言模型在生成式AI中的應用廣泛而有效,例如智能客服、文案生成創作、資料自動化解讀分析等等,皆是藉由大型語言模型來達成作業自動化,並提高工作效率。

生成式AI的痛點、挑戰與解方

不過,從2023年劍橋字典選出的年度代表字:Hallucination,幻想,其實就反應了AI的可信賴性是一大挑戰,因為生成式AI對於沒看過的資訊會想辦法拼湊出答案。模型生成的內容可能表面上看起來合理,實際上卻缺乏真實的參考來源,這種現象在回答專業知識問題時更為明顯,因為模型可能傾向根據在訓練數據中學到的資料來生成答案,而非真正理解問題及實際參考文章來進行答覆。

面對上述問題,檢索增強生成(Retrieval-Augmented Generation, RAG)技術是一個良好的解決方案。RAG是2020年由Patrick Lewis提出,其結合了檢索和生成式AI的優勢,首先檢索外部資料庫中的相關資訊,再基於這些資訊生成回答,藉此減少憑空杜撰的可能性、增強回覆的相關性和真實性,進一步提升問答效果,確保符合實際應用需求。

▲檢索增強生成技術(Lewis, P., 2020)

除了RAG, 2022年1月Google研究員Jason Wei提出的思維鏈(Chain-of-Thought, CoT)概念,則是在大型語言模型的輸入中,加入額外的例子和描述作為上下文,以此幫助模型在進行任務時引入更多的思考過程,並引導模型進行更深入的推理,透過預測「思維過程」來提高模型的性能,讓大型語言模型能夠更好地理解並回答複雜的問題。

▲思維鏈(Wei, J., 2022)

生成式AI的應用實例

檢索增強生成技術與思維鏈的概念提升了生成式AI的性能,也拓展了大型語言模型在多個領域的應用範疇。下文將著重說明大型語言模型如何應用於「政策評估」:
  1. 透過大型語言模型對文本進行摘要,找出重點

在進行政策評估時,會需要針對如會議記錄、訪談內容、問卷中的開放式問題或網路輿情等資料進行質性分析,以歸納出多元利害關係人的相關意見或質疑。此時,結合自然語言處理(Natural Language Processing, NLP)技術與大型語言模型(Large Language Model, LLM),便能夠讓分析更有效率,避免過去逐篇檢視文本後才能找出重點的耗時過程。

首先,為瞭解民眾對於議題有哪些重要的意見面向,可藉由AI語意模型對民眾言論文本進行「重要關鍵字提取」與「語意相似度計算」,並輔以分群演算法將相似討論進行歸類,拆解出不同的討論面向,作為政策評估時的參考。下圖是「晚婚 / 不婚議題」在社群討論當中的分群結果,圓圈大小代表討論的顯著(集中)程度,而圓圈彼此之間的距離則代表討論的相似程度。

▲「晚婚 / 不婚議題」社群討論分群結果
根據分群結果,再透過其他來源如相關文獻或訪談內容,進一步辨識出可進行分析研究的意見,接著提取重點關鍵字、並以布林邏輯篩選資料,統計關鍵字的出現頻率。完成各個討論面向的資料篩選後,藉由以大型語言模型(LLM)為基礎的生成式AI進行解讀與分析,自原始留言、發文內容中歸納出白話的討論面向與重點摘要。下表是以晚婚不婚議題經過辨識後,其中兩個討論面向的摘要內容:
▲「晚婚 / 不婚議題」討論面向摘要
  1. RAG:搜尋引擎結合大型語言模型,提升研究效率

針對政策評估時所蒐集的大量質性資料,過去往往需要花費大量時間解讀,才能從中找出關鍵課題。透過檢索增強生成(Retrieval-Augmented Generation, RAG)技術,將搜尋引擎與生成式AI優勢相融合,便能快速將文本資料中的重點知識內容,轉化成淺顯易懂的重點說明。

首先,搜尋引擎能夠直接對多種格式的文件進行文本上的解析,在搜尋時也能夠進行跨檔案的比對;生成式AI演算法則可以探索和分析複雜的資料。在針對某個議題、概念進行研究時,「搜尋引擎 + 生成式AI」能夠即時從龐大的資料庫中搜尋相關命中段落,並將這些內容快速摘要呈現;透過理解語言的結構和語境,也能確保命中段落的展示是精確且相關的。

簡言之,RAG是在檢索讀取(Retrieve-Read)的框架下進行搜尋(Yunfan, G. ,et al, 2023),能夠識別並找尋給定的相關資訊需求(Zhao, P. , et al, 2024),基於對命中段落的理解,使生成式AI能夠進一步生成摘要,協助使用者在短時間內獲得專業且易理解的回覆,避免在研究、搜集過程中浪費時間在無關或不確切的資訊上。例如,面對大量的訪談逐字稿文件,透過RAG技術進行知識搜尋與知識問答,分析者不僅能彙整並凸顯資料中的重要發現,還能驗證對特定解釋的認知是否正確。此外,它也提供了深入洞察,如識別特定發言者在資料中的關鍵觀點,或對比不同發言者對同議題的立場。

下圖呈現RAG技術如何在資料中發現重點,針對公正轉型研討會講座文字記錄文件進行提問,試問「女性在公正轉型中會受到什麼影響」,RAG迅速對該文件進行搜索,並以條列式回覆重點摘要,同時將參考段落的位置標示出來。

▲以RAG技術彙整資料重點;意藍「AI Search for KM新一代生成式AI知識管理系統」問答畫面
下圖則是詢問某發言者在會議中的發言重點,RAG能夠快速歸納文件中的相關內容,亦標記參考段落之位置,方便搜尋者在文件中找到關鍵資訊。
以RAG技術歸納發言者發言重點;意藍「AI Search for KM新一代生成式AI知識管理系統」問答畫面
▲以RAG技術歸納發言者發言重點;意藍「AI Search for KM新一代生成式AI知識管理系統」問答畫面
生成式AI技術的運用,使得從龐大資料中提取有價值的訊息變得更加高效和精確,從而增強了循證決策的整體效能。
本文引用、改寫自【循證決策協作平台】上112年度計畫團隊技術組之文章,歡迎前往閱讀原文:
<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>行銷公關的智能變革:AI助力品牌戰略轉型升級

精華文章行銷公關的智能變革:AI助力品牌戰略轉型升級

行銷公關的智能變革:
AI助力品牌戰略轉型升級

隨著AI人工智慧技術不斷創新突破,各行各業皆迎來前所未有的變革,例如在行銷與公關領域,AI的應用便重塑了品牌解讀市場訊息、與消費者互動的方式,也開拓了企業提升各項決策精準度的可能性。本文將帶您探討AI如何為行銷公關領域注入新動能,並藉由意藍的解決方案實際展示AI技術在應對公關危機、提升廣告投放精準度等方面的具體應用。

應用1:AI輿情應變顧問

在數位媒體蓬勃發展、資訊爆炸的現代,消費者的聲音和反饋對於品牌的影響日益顯著,負面輿論一旦出現,往往會在短時間內發酵,企業需要作出即時、恰當的應對,才能避免自身形象和信譽受損。因此,如何快速掌握輿情、進行公關危機處裡以防止負面影響進一步擴大,便成為品牌形象管理的重要課題。
以往企業會使用社群聆聽(Social Listening)或是媒體監測(Media Monitoring)工具,來了解社群網路或大眾媒體是如何提及、討論企業自身形象,這類工具蒐集處理了大量的輿情數據,且通常配合搜尋引擎及語意分析技術,協助使用者過濾出有用的資訊。而隨著AI 技術的進步,意藍的「AI輿情應變顧問」,則為此情境開創了全新的可能性。
AI輿情應變顧問基本介紹
意藍的「AI輿情應變顧問」結合DeepNLP與eLAND GOAT大語言模型,並以全台最大的網路口碑資料庫OpView作為資料基礎,僅須透過簡單的自然語句問答,AI 便會梳理大量文本並生成議題摘要內容,讓使用者能夠輕鬆且快速地掌握事件多面向輪廓。簡言之,其亮點特色如下:
  1. AI 技術結合完整、最新的在地資料,查詢結果可靠、可檢視
  2. 自然語句輸入生成列點式回答,快速了解事件全貌
接著,我們將以國內公開上市櫃公司中的王品集團,在一次食安事件風波中的應對過程為例,從事件發生、社群網路及大眾媒體公開討論,到最後事件妥善處理落幕,實際展示AI輿情應變顧問能夠在公關事件中起到怎麼樣的作用。
AI輿情應變顧問應用實例
首先,透過觀察聲量的趨勢圖,可以大致將此次公關事件劃分為三階段,分別是事件初爆發之前期、事件逐漸延燒之中期及事件落幕之後期。
王品集團食安事件 公關危機三階段

▲王品集團食安事件 公關危機三階段

在公關事件爆發初期,品牌方會需要盡速釐清事件的來龍去脈,並盤點可能造成的相關影響,藉此評估危機嚴重程度。此時我們可以透過自然語言對AI輿情應變顧問進行提問,如輸入「最近王品集團食安議題發生原因為何?該事件有哪些影響層面?」,其便會以列點方式回答,顯示事件涉及顧客信任、經濟損失、衛生與法規問題等多個面向。
王品集團食安事件 輿情應變問答範例(前期)

▲王品集團食安事件 輿情應變問答範例(前期)

而隨著公關事件逐漸延燒,品牌則需全面性地掌握社會大眾的關注重點,並決議以何種方式應對聲明、執行有效的止損措施。我們可以向AI輿情應變顧問提問「網友對於王品集團食安議題有哪些討論面向?」,根據其回覆,可以得知民眾在本次事件中在意的面向包含集團員工衛生管理是否確實、餐廳是否定期清潔消毒等,並關注集團後續面對顧客之補償措施。
王品集團食安事件 輿情應變問答範例(中期)

▲王品集團食安事件 輿情應變問答範例(中期)

最後,在品牌針對該事件做出回應後,亦可透過觀察網友給予的回饋,檢視事件是否落幕、企業品牌是否重新拾回消費者信心。AI輿情應變顧問能夠協助總結品牌做出的處理方針與民眾反饋,包含以直播廚房作業加強消費者對餐廳衛生的信心,以及對消費者進行賠償、展現願意負責任的態度等,逐步平息公關危機與修復品牌形象。
王品集團食安事件 輿情應變問答範例(後期)

▲王品集團食安事件 輿情應變問答範例(後期)

應用2:AI智能廣告投手

上段說明了AI技術的導入如何賦能企業迅速掌握輿情、有效應對公關危機;而除此之外,AI技術亦能為精準行銷、廣告投放等領域注入新動能。對於品牌而言,準確識別目標受眾並制定有效的行銷策略,可說是提升轉換率、加強顧客忠誠度的關鍵課題,而若企業品牌想要針對目標市場,精準觸及到關注自身或特定輿情的受眾,意藍的AI智能廣告投手便能有效提供協助。

AI智能廣告投手簡介
意藍的「AI智能廣告投手」結合了搜尋引擎、DeepNLP技術及大型語言模型,以AI分析《OpView社群口碑資料庫》上的社群輿情,並將數據轉化為對應「關注特定輿情」的人群樣貌,描繪出話題討論之關注受眾;使用者可以動態調整欲觀測之主題、期間以及來源,或進行網站探索以及自訂內容,最後系統將一次性地產出Google、Meta及PeopleView人群資料庫等多平台推薦的標籤結果,使品牌得以精準鎖定目標客群。

▲AI智能廣告投手亮點特色

AI智能廣告投手應用實例
我們以國內知名的金融業者為例,透過AI智能廣告投手,以公開的社群討論及媒體輿情為基礎,精準計算關注人群的樣貌,進一步顯示廣告投放平台Google Ads推薦的標籤查詢結果。如下圖,可見「玉山銀行信用卡」受眾的關注重點聚焦於房地產、信用與貸款等,競品「國泰世華銀行信用卡」之受眾則著重日常消費,如旅遊、家庭度假等,而此便可作為品牌投放廣告前拓眾的參考依據;經由探索自家與競品的受眾標籤,企業也能進一步選擇是要拓展相似標籤客群,抑或與競品作出區隔、創造獨特性。

▲玉山、國泰世華信用卡話題討論之受眾標籤;資料分析期間:2024Q1

另一方面,AI智能廣告投手也可用於探索特定頻道受眾,例如當品牌想尋找KOL(關鍵意見領袖,Key Opinion Leader)作為宣傳行銷活動的合作對象時,也可以分析關注該KOL的受眾樣貌,進一步探索其受眾標籤,確認與品牌想鎖定的客群是否契合。
AI智能廣告投手 特定KOL受眾標籤

▲AI智能廣告投手 特定KOL受眾標籤

在數據驅動的時代下,AI為各行各業注入了全新的動能,成為企業發展和創新的重要推手。透過AI技術與應用,企業得以借力使力,以更加智能、精準的分析實現更高效的運營,發掘出嶄新的商業機會。

想進一步了解「AI輿情應變顧問」和「AI智能廣告投手」嗎?

<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>AI自然語言處理技術應用:意藍DeepNLP革新

精華文章AI自然語言處理技術應用:意藍DeepNLP革新

AI自然語言處理技術應用:
意藍DeepNLP革新

自然語言處理(Natural Language Processing,NLP)是AI技術的一種,目的在讓電腦能「理解」並「說出」人類的語言,而意藍DeepNLP深度語意分析模組則是商業化運用最成熟的NLP技術產品之一。本文除了說明自然語言處理技術的原理與優勢外,也將同步介紹意藍DeepNLP技術與AI應用的結合。

意藍的自然語言處理商業化應用

什麼是自然語言處理?

自然語言處理(Natural Language Processing,NLP)是AI人工智慧的一個分支領域,旨在讓電腦能夠「聽得懂」和「說得出」人類語言。

在自然語言處理的領域中,包含以下幾種常見的技術:

  1. 語意分析:理解文句中的意圖、情感,例如意藍自主研發的DeepNLP深度語意分析模組所提供的情緒分析、文本摘要、屬性詞分析等功能。
  2. 語音辨識:將語音轉換成對應的文字內容,例如Google的語音輸入功能。
  3. 文本生成:生成自然且合乎語法的文字內容,例如ChatGPT的文本識別、輸出功能。
  4. 機器翻譯:將文本從一種語言轉換成另一種語言,例如Google翻譯。

意藍DeepNLP技術服務內容
意藍的DeepNLP語意分析模組是國內最早投入,也是商業化應用最成熟的自然語言處理技術產品,能透過深度學習擷取非結構化資料的文本內容、判讀語意情緒、自動摘要文本重點、分析特徵詞與斷詞,將質化文本用於量化統計。
而DeepNLP技術也被應用在意藍的產品當中,其中OpView雲端資料分析服務會針對大量的輿情資料進行情緒分析,來理解文本中的情感,辨別出文本表達的情感是正面、負面或是中立,幫助企業了解輿情對產品、品牌或事件的態度,有助於調整行銷策略和危機應對。除此之外,透過DeppNLP技術還可以抓取文本中的重點資訊,進而掌握公眾關注的重點面向或事件,以制定相應的決策和宣傳方案。透過自動摘要則可以從文本中提取出重要的句子或段落,生成簡潔的摘要,有助於企業迅速理解和分析大量的文本資訊。

大語言模型的興起與優勢

大語言模型的核心特點
大語言模型(Large Language Models,LLM) 是基於自然語言處理所發展的技術,能夠進一步理解自然語言文本,並生成各式各樣的內容,目前國際上較為知名的大語言模型包含OpenAI的GPT系列、Meta的LLaMa系列、Google的Gemini與Gemma系列等。為讓大語言模型能夠更加在地化,國內也積極研發本土大語言模型,如意藍所發展之eLAND GOAT。而大語言模型則主要有以下幾個核心特點:
  1. 大量的數據訓練:透過讓模型從大量文本數據中訓練來學會語言知識。
  2. 上下文理解:能夠理解和生成上下文相關的文本,提供流暢的回覆。
  3. 應用場景廣:有別於過往的模型多只在特定領域表現良好,大語言模型可以用於多種自然語言處理任務上,包括文本生成、翻譯、摘要、問答等。
大語言模型對自然語言處理的強化

大語言模型的發展推動了自然語言處理技術的進步,透過持續的訓練模型,可以更強化自然語言處理的效果,包含:

  1. 語意理解能力更佳:能夠更準確地理解文本中的語意,從而提高自然語言處理系統的性能。
  2. 文本生成能力更強:能夠生成更自然、連貫甚至更貼合使用者需求的文本,在聊天機器人和文本生成工具等方面都有很大的應用潛力。
  3. 多語言處理能力更好:具備多語言處理能力,可以在多種語言之間,進行翻譯和語意的理解。
 

意藍結合搜尋技術、自然語言處理與大語言模型,提升產品效果與體驗

隨著近年生成式AI技術的竄起,意藍也跟上這波技術革新的潮流,基於原有的搜尋技術與DeepNLP技術,再結合生成式AI技術如大語言模型來優化產品服務與體驗,包括:

  1. OpView:意藍運用大語言模型在生成文本上的能力,提供輿情摘要功能,讓使用者在進行輿情觀測與分析時,可以跳脫過往繁瑣的工作流程(例如:在框定議題範圍後,還需人工一篇一篇檢視、吸收消化再整理成重點等耗費時間的作業模式),更快速有效率的取得議題、貼文的討論重點。  此外,OpView也結合大語言模型推出新功能「AI輿情應變顧問」及「AI智能廣告投手」,讓使用者不僅可以在平台上進行輿情觀測與分析,更能進一步地根據輿情資訊,了解關注受眾的樣貌,進而作為精準行銷及廣告投放之參考依據。其中,在AI輿情應變顧問中,意藍結合自身的搜尋引擎技術與檢索增強生成(Retrieval-Augmented Generation, RAG) 技術,讓使用者可以在短時間內,便獲得由AI從數以萬計的輿情資料中萃取、彙整並消化重點後所進行的問題回覆。
  2. AI Search for KM:意藍結合DeepNLP技術、大語言模型以及搜尋引擎技術,提供知識搜尋與問答的服務,可以作為企業的AI知識助理或AI學習教練,能快速的從大量的檔案文件中找出所需內容,並附上參考內容出處供驗證。本產品透過自然語言處理技術結合語意向量搜尋,可以進一步從相關檔案文件中,找出與使用者問題最相關的資訊,再由意藍發展的eLAND GOAT大語言模型加以彙整、內化後,以自然語言的形式回覆給使用者,協助使用者可以快速地取得精準且易懂的問題回覆,解答自身問題、減輕知識內化的時間成本與負擔。

意藍將DeepNLP技術與大語言模型結合,提升產品服務多樣性,藉由AI協助企業客戶簡化輿情分析、知識檢索的繁瑣流程與成本,實現更全面的商業應用服務。 

想進一步了解更多意藍AI技術嗎?

<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>AI驅動的城市未來:意藍資訊AI智能搜尋解決方案

精華文章AI驅動的城市未來:意藍資訊AI智能搜尋解決方案

AI驅動的城市未來:
意藍資訊AI智能搜尋解決方案

意藍資訊 (6925) 是國內首家公開掛牌的AI智能數據代表廠商, 憑藉自有核心技術 Search搜尋、NLP語意分析、ETL數據處理,更進一步結合生成式AI,為企業/組織提供多元的新一代AI智能解決方案。

本期 AI 知識庫亮點

意藍資訊核心技術

意藍資訊的核心技術包含Search搜尋、NLP語意分析、ETL數據處理
  1. Search搜尋
    以工業級C++技術打造自有核心,並透過獨家的P2P點對點分散式部署架構,讓系統可以乘載巨量數據處理規模,並保有遠勝於開源項目的處理效能、同時具備良好的多國語言搜尋能力。
  2. NLP語意分析
    意藍在自然語言處理上專研多年,以深度學習(Deep Learning)技術為基礎打造出新一代的語意分析核心技術(Deep NLP),提供包含斷詞、情緒分析、屬性詞擷取、自動摘要等成熟技術,兼具準確度及處理效能,可連續處理巨量數據,並從數據中學習。
  3. ETL數據處理
    透過分散式平行化自動擷取架構,讓意藍在資料爬取與清理方面,可以適應多種數據,處理量大、變動快的非結構化資料,讓各使用單位可以即時快速、有系統地運用所需資料。
而乘著AI熱潮,意藍更進一步結合生成式AI,開發出eLAND GOAT大語言模型及檢索增強生成RAG(Retrieval-Augmented Generation)技術,推出各式AI智能搜尋解決方案,滿足企業在不同場域的應用需求;而以下將自「智慧城市災防應變」、「智慧政府民意陳情資料分析」兩大應用情境為例,向大家介紹意藍如何為合作夥伴實現AI落地應用。

意藍AI Search智能搜尋解決方案

協助智慧城市災防應變數據分析
面對嚴峻的自然災害挑戰,災害防救單位需快速且準確地掌握災情資訊,提升災害應變效率。而意藍透過先進的AI技術,結合社群輿情資料和專屬的歷史數據庫,為災害防救單位提供高效的解決方案,解決資訊來源分散、數據處理繁複等痛點,協助單位提升資訊處理效率,並提供數據支持決策判斷,以便更好地應對和管理災害風險。分項說明如下:
[AI結合社群輿情資料,協助城市災防治理 – 分析儀表板]

為即時蒐集社群輿情中的災情資訊,意藍擷取分析眾多公開網站頻道的資料源,涵蓋各大公開媒體、Facebook粉絲團、Dcard、巴哈姆特各地區版、Mobile01地區版及PPT地區版等等,將巨量資料結構化並過濾之後,透過意藍的搜尋引擎,便可針對大量資料做搜尋。

接著,透過語意分析技術,讓AI自動判別每一篇災情文章內容中提及的地理資訊、災害事件以及災情程度等,將這些重要詞彙辨識出來並自動標記。

最後,將這些社群輿情中的災情內容與AI自動標記之結果,展示在分析儀表板上,讓災害防救應變相關單位可以利用搜尋快速找到相關內容,並從儀表板了解與統計各個地方民意反映的災情狀況、發生頻率等等,以利後續分析和災防治理。

[AI結合歷史數據,協助應對自然災害 – 歷史災害事件問答]

配合災害防救單位之需求,意藍利用生成式AI與自然語言模型,整合歷史災害防救數據,結合eLAND的AI Search For KM服務,建立災害防救事件問答系統,幫助災害管理或救援人員應對自然災害的挑戰。

災害防救單位可針對歷年災害事件做問答,AI Search for KM系統會依據提問找到多個參考段落,再由大語言模型綜合歸納出完整的答覆。以下為幾個問答情境:
  1. 山竹颱風在哪些地區有較大雨勢?
    AI Search for KM 回覆:根據提供的文章資料,我們可以得知山竹颱風在【文章A】、【文章B】和【文章C】中提到了有較大雨勢的地區。在這些文章中,指出受颱風外圍環流影響,花蓮、台東、屏東縣(山區、恆春半島)將有較大雨勢發生。此外,【文章C】也提到了台灣東部、屏東縣(山區、恆春半島)及南投縣、高雄市山區也將有較大雨勢發生。因此,根據這些文章的資訊,山竹颱風預計會在花蓮、台東、屏東、南投和高雄等地區帶來較大的雨勢。
  2. 梅姬颱風對台東造成什麼災情?
    AI Search for KM 回覆:梅姬颱風對台東造成了顯著的災情,包括淹水、道路坍方和農業損失。根據【文章F】,台東縣知本溪流域溫泉橋上游左岸堤防溢堤,導致溫泉村40戶民宅淹水,而右岸山坡則有雨水夾帶土石沖入富野飯店,民宅內土砂淤積達50公分以上。此外,梅姬颱風也對台東及屏東部分地區造成淹水和道路坍方,農業損失約1.9億元,並造成12人受傷。這些災情反映了梅姬颱風對台東地區的嚴重影響,包括對居民生活、基礎設施和農業的破壞。
  3. 梅姬颱風會對哪些地區影響較劇烈?
    AI Search for KM 回覆: 梅姬颱風對臺灣的影響最劇烈的地區包括臺北市、新北市、桃園市、新竹縣市、基隆市、花蓮縣、臺東縣、屏東縣、高雄市、臺南市、嘉義縣市、雲林縣、彰化縣及澎湖縣。這些資訊來自於【文章G】,其中明確指出這些縣市為梅姬颱風風災高風險區。此外,【文章H】 也提到梅姬颱風10級風暴風圈主要通過的縣市包括花蓮縣、臺東縣、屏東縣、高雄市、臺南市、嘉義縣市、雲林縣、彰化縣、南投縣、及澎湖縣,這進一步確認了上述地區將受到較劇烈的影響。這些資料綜合顯示,梅姬颱風將對臺灣南部、東部以及部分中部和北部地區帶來顯著的風災和降雨影響。
智慧政府民意及民眾陳情資訊分析
地方政府經年累月從派工系統、話務系統、人民陳情與市長信箱等來源接獲的民眾陳情資料相當龐雜,無論是市府人員後續欲整理民眾陳情資料進行分析,或是借鑒過往民眾陳情案件的回覆用於新案件回覆,皆費時費力;因此,意藍運用AI技術,提供市府陳情儀表板與陳情問答輔助解決方案,協助地方政府得以更有效分析資料及輔助陳情回覆 。分項說明如下:
[AI語意分析結合資訊結構化處理 – 陳情儀表板]

整合各來源資料,並透過意藍DeepNLP技術,分析民眾陳情情緒、擷取陳情內容特徵資訊等,整理成結構化資訊。

接著,採用意藍搜尋引擎技術,讓使用者可以藉由彈性的檢索條件快速查詢到想了解的特定陳情案件。

最後則進一步將結構化後的陳情資料整合成儀表板,提供視覺化圖表供使用者可以快速、清晰的了解案件概況與量化數值,並應用於後續分析。

[AI智能問答 – 陳情客服輔助]

在此項解決方案中,政府單位人員可直接輸入收到的民眾陳情內容,陳情問答輔助服務會先去除其中的個資及敏感資訊,嚴格控管資安不外洩,再將陳情內容清整後與過往陳情案件進行比對,獲取與本次陳情相關、過往曾經處理過的案件資訊,並透過生成式AI整合後產出AI自動回覆模板,輔助政府單位人員更有效率的回覆陳情案件,提升客服效率並減輕人力負擔。

此外,意藍的陳情客服輔助服務也具備以下特點:
  1. 回覆模板有依據
    服務會自動參考過去相關案件的回覆,以過往的回覆格式與內容為參考,產出適合的回覆內容提供給使用者
  2. 自訂聯絡資訊
    在產出的回覆模板中,使用者可以自己彈性設定應在回覆中顯示何種聯絡資訊
  3. 自訂單位名稱
    在產出的回覆模板中,使用者也可以自行設定在回覆中欲呈現的單位名稱資訊

意藍 (6925)將生成式AI與自身核心技術結合,提供多元的AI Search智能搜尋解決方案,賦能合作夥伴,實現了AI技術在智慧城市災防應變,以及智慧政府民意及民眾陳情資訊分析的落地應用,為AI未來城市發展注入新的動能。

想進一步了解更多意藍AI技術嗎?

<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>掌握檢索增強生成技術,強化企業應用AI的價值:意藍在RAG的應用與展望

精華文章掌握檢索增強生成技術,強化企業應用AI的價值:意藍在RAG的應用與展望

掌握檢索增強生成技術,強化企業應用AI的價值:
意藍在RAG的應用與展望

AI技術發展飛速,而檢索增強生成技術 (Retrieval-Augmented Generation, RAG) 則成了讓大型語言模型 (LLM) 更加高效、智能的關鍵技術。RAG檢索增強生成結合了搜尋引擎與大語言模型,也就是檢索與生成的特點,能有效地先找出精準且相關的內容後,再讓大語言模型依據相關的內容做參考,理解後再生成回答,可以有效解決大語言模型幻想 (hallucination) 的問題,並且能夠提供相關內容的參考出處,增加了可解釋性 (Explainability) 和可驗證性 (Verifiability),並且能夠透過搜尋引擎來快速變換參考的相關資料,不需要對大語言模型進行再訓練,具備了速度和成本效益優勢,其企業應用範圍與情境更是廣泛。本文將深入探討RAG檢索增強生成的原理、優勢與應用場景,並說明意藍在此技術下的應用實踐。

認識檢索增強生成 (RAG)

什麼是檢索增強生成?

檢索增強生成 (Retrieval-Augmented Generation, RAG) 是一種結合了檢索 (Retrieval) 和生成 (Generation) 兩種方法的人工智慧技術,從大量的文本資料中搜尋相關的資訊,並基於檢索到的資訊生成更具體、更可信的答案。

檢索增強生成的優勢與挑戰

生成式AI在生成內容時,可能會出現杜撰答案或是答非所問等AI幻覺 (hallucination) 之情況。而檢索增強生成能解決此問題,增加其可解釋性和可信度,整體而言可歸納為以下優勢:

  1. 依照相關的參考資訊來生成內容,可以提高生成內容的準確性和品質,避免生成虛假、不切實際的誤導性資訊
  2. 增加可信度與可驗證性,確保生成的內容具有可靠的參考依據,而非僅根據過去的學習經驗推測,且生成的內容可被檢查驗證。
  3. 節省訓練成本,更快速地更新知識。由於訓練 (或微調再訓練) 語言模型新知識都需要大量的時間和金錢成本,但RAG檢索增強生成能利用現有模型,只要透過搜尋引擎快速更新相關的參考資料,就可以反應生成結果上,不必進行新一輪的訓練,更新速度快、成本也低。

除了具備以上優勢外,一個好的RAG檢索增強生成技術需在實際應用中克服以下挑戰,以發揮其潛力並有效提升效能:

  1. 無檢索結果時的回覆

    當檢索增強生成沒有檢索到得以回答使用者問題的知識時,需判斷並回覆無相關參考資料,不要硬答,避免大語言模型杜撰答案,才不會出現AI幻覺問題。

  2. 生成回覆內容的實用性

    檢索增強生成需確保生成之內容不僅與檢索到的知識相關,且還需具備流暢性、準確性及實用性。

  3. 效率和擴展性

    隨著知識庫不斷擴大,檢索增強生成需維持檢索和生成過程的效率與精準度。

  4. 實際應用彈性

    應用檢索增強生成時須考慮到不同領域的需求,有些領域的知識點敘述較長、有些領域知識較分散,需能彈性調整段落長短、段落數多寡等,真正能夠完整地找出相關的內容,以符合不同的應用場景,這將是關鍵重點。

RAG檢索增強生成的應用場景

RAG檢索增強生成適用於需要透過相關的參考資料來輔助回答的問答系統、智能對話系統以及其他自然語言處理應用,來滿足客戶在不同場域的各種需求,如:

  1. 問答系統

    用於需要透過相關的參考資料來輔助回答的問答系統,例如客服人員使用的常見問答集 (Frequently-Asked Questions, FAQ) 或標準作業程序 (Standard Operation Procedures, SOP),特別是在回答專業知識問題時,RAG檢索增強生成能提供更精準及可靠的解答。

  2. 智能對話系統

    對話系統通常需結合大量知識來回答使用者的問題,RAG檢索增強生成可協助系統更好地理解用戶的問題並提供具有明確出處和連貫性的回應。

  3. 知識檢索及擴充

    企業或組織通常擁有大量的內部知識資源,包括文件、報告、手冊等。RAG檢索增強生成可協助使用者快速檢索到所需的知識資訊,同時也可不斷擴充相關知識,提供更全面、深入的內容。

  4. 知識管理

    RAG檢索增強生成可協助組織更有效地管理和利用大量的知識資源,以提高知識的可用性及共享性,促進團隊合作和創新。

RAG檢索增強生成的應用實例
而RAG檢索增強生成又能應用在哪些場域呢?接著我們進一步說明應用實例如下:
  1. 輿情分析
    針對特定事件、議題,蒐集並觀測社會大眾的意見進行輿情分析,檢索增強生成可透過檢索大量相關的社群網站貼文、討論區評論、新聞文章等資料,找出特定內容做為參考,讓與搜尋引擎高度整合的大語言模型來生成對應的摘要或分析結果。此方式能從大量的資料源找出可用資訊,對輿情進行全面準確的分析,同時也保持生成內容的靈活性和即時性。
  2. 財經分析
    在金融領域,RAG檢索增強生成可透過檢索過去至今完整相關的重大訊息、公開說明書、市場數據、公司報告、專家評論等資料,生成對於當前市場概況的歸納或未來趨勢的預測推論。此方式可充分利用豐富的歷史資料,同時了解即時的市場資訊,有助於提高分析預測的準確性和可信度。
總結而言,因大語言模型進行預先訓練或微調需要耗費大量時間和資源,無法即時應對快速變動的環境,而 RAG檢索增強生成能藉由結合檢索 (搜尋引擎) 和生成 (大語言模型) 的方法,即時地分析大量的資訊,有效協助使用者更佳理解及應對快速變動的情況。

意藍資訊於檢索增強生成的應用

意藍結合RAG檢索增強生成的發展優勢

RAG檢索增強生成的概念是高度整合搜尋引擎與大語言模型,先透過檢索功能找出完整相關的參考資料,再基於大語言模型的理解和生成能力,讓該模型進行摘要,進而生成即時、精確的答案,因此搜尋引擎的好壞便成為RAG檢索增強生成出色與否的重要因素。

而意藍資訊在數據處理及分析領域深耕多年,也 將搜尋技術 (Search) 與自然語言 (NLP) 經驗結合,不僅能兼顧傳統關鍵字檢索的精準快速搜尋,以及向量搜尋可支援自然語言提問的特點,提供使用者更佳的檢索功能與卓越的RAG檢索增強生成服務體驗。

此外,擁有RAG檢索增強生成的系統就有如口袋中放了百科全書,使得在生成內容時不再受限於過往訓練的資料,而能即時瀏覽大量的專業知識文件,以解決特定領域的複雜問題,進一步提升問題解決的效率。且面對資訊爆炸的今日,新資料推陳出新,有了RAG檢索增強生成技術,可讓我們的產品與技術持續從新數據學習及擴展知識庫,使產品在任何情境下都能保持訊息的即時性。

意藍於檢索增強生成的應用

而意藍資訊在RAG檢索增強生成主要有以下應用:

  1. 訓練大語言模型

    意藍自行研發並訓練了大語言模型eLAND GOAT,能夠與搜尋引擎高度整合並進行優化,用以加強RAG檢索增強生成中對於參考相關資訊的摘要及回答的能力。

  2. AI Search for KM新一代生成式AI知識管理系統

    我們將RAG檢索增強生成應用在知識管理領域,透過結合搜尋、NLP與大語言模型打造出新一代生成式AI知識管理解決方案,提供使用者更高效、智能的知識搜尋與問答服務體驗。

  3. AI輿情應變顧問

    將RAG檢索增強生成結合最完整、最即時的網路聲量資料,提供以自然語言口語文字查詢,就可以彙整、生成輿情重點,依照真實內容來提供AI應變建議,可以應用在市場研究、行銷趨勢、公關應變,任何需要快速掌握輿情重點的企業場景中。

意藍 AI 技術的未來展望
我們相信, 整合了搜尋引擎與大型語言模型 (LLM) 的RAG檢索增強生成技術,能夠轉化為企業的知識和營運數據中心。這意味著企業中的多個重要系統,如知識管理 (KM)、企業資源規劃 (ERP)、客戶關係管理 (CRM) 以及人力資源 (HR) 等,都可透過RAG檢索增強生成技術進行整合,不僅能提高數據的利用效率,也能加強企業的資料治理能力,讓企業更加依循正確的資料做出有效決策。展望未來,我們會持續致力於透過AI技術讓數據增值,並進一步賦能合作夥伴,協助提升企業營運效能。

想進一步了解更多意藍AI技術嗎?

<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span> 生成式AI的商業機會與挑戰:意藍資訊在 AI 技術上的應用

精華文章 生成式AI的商業機會與挑戰:意藍資訊在 AI 技術上的應用

生成式AI的商業機會與挑戰:
意藍資訊在 AI 技術上的應用

生成式AI是一種人工智慧技術,主要特點是能夠生成新的內容,例如文字、圖像或音訊,來解決問題。而意藍資訊除了有自行研發的大語言模型eLAND GOAT外,也推出了許多的AI智能數據解決方案。

本期 AI 知識庫亮點

認識生成式AI

生成式AI的原理是什麼?
生成式AI是 基於深度學習,透過擁有大參數量的神經網絡來記憶學習大量的資料,並且在沒有明確標籤或指導之下,自行學習資料的分佈,來生成更多類似的資料。工作邏輯就好比文字接龍遊戲,使用者在輸入詞句後,生成式AI便會根據過往學習時曾看過的訓練資料,來評估該詞句接下來在高機率的情況下會產生的字詞為何,並進行相對應的文字生成。

目前的生成式AI通常會配合兩種建立模型的技術,第一個是預訓練 (pre-train),也就是先在沒有特定任務目標的情況下先進行模型的訓練,之後再將該訓練好的模型投入到實際應用中。打一個比方,就像預先訓練AI的基本語文能力,之後在克漏字測驗、改錯、造句、摘要、閱讀理解等任務上都會用到這些能力;另一個是大模型 (large model),包括不斷推升神經網路模型的參數量規模,以及給予更多的訓練資料,都是希望讓生成式AI的能力及適用狀況可以更加地擴大。

生成式AI的應用場域與未來發展

生成式AI的應用實例
生成式AI可以在文書生成、摘要、提供方法推論、回答知識題等方面提供協助,並且也能在行銷、廣告、政治社會等領域,甚至是學術研究、政府單位當中扮演探索或發想性質的角色。不過需要注意的是,若是要針對如計算題這種有標準答案的內容時,生成式AI有時可能無法完全正確的回應,這時就會需要仰賴使用者再多留意與求證。
生成式AI的挑戰與未來趨勢
2023年劍橋字典選出的年度代表字:Hallucination (幻想),其便反應了人工智慧的可信賴性會是一大挑戰,尤其生成式AI有杜撰、編造消息來源的不可控性。因為生成式AI的能力一大部分是仰賴過往曾經看過的訓練資料再經過類似機率選擇的過程來生成內容,因此存在不確定性,以及拼湊內容、無中生有的可能。另外,生成式AI還有資安風險的隱憂,例如提供的資訊被模型業者拿去做為訓練模型之用,而近來也有許多例子都能證實,即使在訓練模型時設了重重關卡,訓練出來的模型還是可能會在無意之間把公司內的機敏資料洩漏出去。

而要克服這些問題,首先我們要能讓AI產出的答案變成是載明參考資料出處且可驗證的。在未來,生成式AI模型一定會不斷推陳出新,成為繼30年前圖形化界面 (Graphical User Interface) 之後,最大的一個人機界面革命,可以理解使用者的口語表達並完成各項任務的自然介面 (Natural User Interface)。目前已有利用生成式AI的自動化框架,能夠將一個任務的所有工作流程進行拆解的案例,使得生成式AI可以去完成每一個環節相應的步驟,成為生成式AI發展的趨勢方向。

意藍資訊的AI服務應用

意藍大語言模型eLAND GOAT 與 OpenAI的差異
而為了解決生成式AI在應用上的幻想杜撰、資安等問題,以及台灣本土大語言模型缺乏繁體 (正體) 中文語料等情況,意藍資訊也在AI領域持續追求成長與卓越。相較於OpenAI的GPT模型,由意藍所自行研發出的大語言模型eLAND GOAT,即是以大量台灣社群網站、網路媒體的繁體中文語料進行訓練,具備了更好的繁體中文理解、生成能力,在使用上能夠提供更為在地化的體驗。此外,相較於OpenAI僅提供放在公有雲上的模型,eLAND GOAT能夠提供企業小型化、特式化 (specialized) 的地端模型,可以運行在企業內部環境中,依循企業組織的權限設定,滿足企業對於資安上的需求。
意藍AI智能數據解決方案

除了大語言模型eLAND GOAT,意藍資訊也致力於發展各式AI智能數據解決方案,來滿足客戶在不同場域的各種需求,如:

  1. 輿情GPT

    結合全台最大的社群口碑資料庫OpView,讓使用者能夠在輸入簡單的關鍵詞後,快速找出最相關的資料,並藉由生成式AI來生成口語化、條列重點的輿情精華摘要,解決過去在解讀社群輿情時,需要人工對話題逐篇檢視、理解的時間。

  2. AI Search for EC 新一代智能貼標與搜尋推薦系統

    以AI語意分析技術,自動解析商品中所帶有的各式資訊文本,生成能代表商品的重點標籤,再綜合評估聲量、搜量、銷量等多元指標,能有效解決電商品牌在商品曝光、推薦、搜尋引擎優化上的各項痛點,讓消費者可以更精準的找所需的商品。

  3. AI Search for KM 新一代生成式AI知識管理系統

    整合了生成式AI、搜尋引擎,和NLP(自然語言處理)技術,讓企業員工只要上傳知識文件後,就可以輕鬆地檢索和提問,且AI Search for KM專注於企業自身所建構的知識庫,確保回答乃基於實際數據和企業內部知識,並提供地端運算方案,避免內部資料外洩風險。

想進一步了解更多意藍AI技術嗎?
<span style=" display: block; font-size: 0.8em; font-weight: 100; color: #A5A3A3;">精華文章</span>本土生成式AI大語言模型的發展與優勢:意藍輿情GPT的技術與應用

精華文章本土生成式AI大語言模型的發展與優勢:意藍輿情GPT的技術與應用

本土生成式AI大語言模型的發展與優勢:
意藍輿情GPT的技術與應用

大語言模型的優勢在於使用了先進的自然語言處理技術,由大參數量的深度學習架構,加上大規模的學習語料,來達到自行理解詞句間關係的能力,進而依照提示來生成各種內容,可以廣泛應用在多種場景,例如理解文章、生成摘要、依提示寫作及問答等。而由於目前繁體 (正體) 中文語料相對較少的緣故,台灣各界都開始投入蒐集與標註繁體中文語料,並以建置本土大語言模型為目標。

本期 AI 知識庫亮點

生成式AI大語言模型的核心特點
本土生成式AI大語言模型的可能性
意藍資訊的生成式AI應用內容

AI大語言模型的核心特點

什麼是大語言模型?
大語言模型 (Large Language Model,LLM) 是一種基於大量資料訓練而成的深度學習模型,其特色在於模型參數量大、學習訓練資料量大。而模型的核心特點在於訓練過程中,可以自行學習、理解大量資料中每個詞句間的關係與背後的意義,成為基礎的預訓練 (pre-train) 模型,隨後再依照不同的任務類別進行微調 (fine-tune),例如成為可以根據指令來提供符合邏輯的自然語言回應。 大語言模型的工作邏輯就好比文字接龍遊戲、或是猜測下一字詞的智慧型輸入法,使用者在輸入詞句後,大語言模型便會根據過學習、訓練的資料,來評估詞句背後高機率會產生的字詞為何,並進行相對應的文字生成。
大語言模型的優勢為何?

大型語言模型的優勢在於使用更先進的NLP (Natural Language Processing),也就是自然語言處理技術。相較於傳統的自然語言處理技術,大型語言模型的優勢包含:

(1)上下文理解:不是只針對字詞本身來解釋,而是透過分析上下文來更好地理解和處理文意,可以解決單一字詞依上下情境會有不同解釋的問題,所生成的回應也會更有連貫性且有邏輯。

(2)多任務適用:經過預訓練的大語言模型,就像有了基本語文能力的AI,對處理各種自然語言處理的任務都會大有幫助,例如有了基本語文能力,則學測中的克漏字測驗、改錯、造句、摘要、閱讀理解等分數都會上升,不需要單獨為每種任務來設計特定的模型,讓模型的應用更多元、廣泛。

(3)大規模資料訓練:透過數十億字符 (token)、甚至到上兆等級 (tera-) 的語料進行大規模的學習,讓模型能夠掌握更豐富的知識,從書籍、百科、論文、資料庫、網頁內容、社群貼文等,進而做出更好的理解與回覆。

本土生成式AI大語言模型的可能性

台灣大語言模型的發展

由於目前主流的大語言模型,如OpenAI的GPT系列,或是Meta的LLaMa系列,在訓練時所使用的語料都以英文為大宗,而中文語料佔比都非常低,其中大部分資料又為簡體中文,和繁體、台灣地區所慣用之用字遣詞有一定差距,因此台灣的產、官、學界也都持續致力於台灣本土大語言模型的發展,如國科會的TAIDE模型、台智雲公司的FFM(Formosa Foundation Model)、聯發科公司下聯發創新基地的breeze模型,以及作為國內自然語言處理的先導廠商 – 意藍資訊所發展之eLAND GOAT模型,目標均是讓大型語言模型能夠更加在地化。

意藍資訊在生成式AI大語言模型的發展

大語言模型的訓練是依靠大量高品質的數據資料來執行,因此意藍挑選出台灣常用的語料,在兼顧適法性及合理使用下,整理出AI的學習材料。除此之外,意藍也發展了自己的自然語言處理演算法與模型,且經過第三方機構的驗證,語意判斷的準確度高達九成。此外,在相關性檢索、情緒判別、與AI對話等競賽中都名列前茅。故在台灣大語言模型的發展中,意藍資訊具備生成式AI領域中最核心的資料、演算法與應用,擁有如輿情分析、數位人群分析、電商搜尋推薦引擎、知識檢索與問答等不同的商業應用方向。

意藍資訊的AI應用內容

輿情GPT的特色與優勢
在研發大語言模型上,由於意藍資訊擁有全台最大、最完整的OpView社群口碑資料庫,再結合意藍訓練研發的自然語言處理技術DeepNLP,成功打造出領先全台的「輿情GPT」服務,讓輿情GPT在面對巨量的語料能夠更有效地處理並加以運用。只需要在輿情GPT中輸入簡單的關鍵詞,便可以在最短時間找出相關的資料,並藉由大型語言模型來生成口語化、條列重點的輿情精華摘要,解決過去在解讀輿情話題時,需要逐篇話題一一進行檢視、理解的大量時間。除此之外,輿情GPT強大的質化分析能力,能讓企業即時掌握突發公關事件的輿情走向,或精準抓住行銷上的流行爆紅元素。
生成式AI技術未來展望
隨著大型語言模型的能力越來越強,大眾對於資訊安全和資料保密議題的重視也日漸增加。企業在大語言模型應用上,常會受限於服務供應商多為公有雲的緣故,不放心將企業重要資訊上傳外露,使得無法讓模型在具備企業內部知識的情況下,提供更精確的產出結果。因此,意藍資訊持續發展企業專屬的地端 (on-premise) 模型,提供企業小型化、客製化的模型選項,並且不斷的探索大型語言模型的應用場景,嘗試、解決企業遇到的商業問題。
想進一步了解更多意藍AI技術嗎?

Copyright eLAND Information Co., Ltd.