### `LLM`
LLM(`Large Language Models`)指的是大型語言模型。這些模型是自然語言處理(NLP)技術的一部分,使用深度學習訓練來理解、生成、翻譯文本,甚至執行特定的語言相關任務,如問答、文本摘要、編程代碼生成等。LLM根據大量文本數據進行訓練,以理解語言的結構、含義和上下文。
LLM的關鍵特征之一是其規模,即模型中包含的參數數量非常龐大。這些參數幫助模型捕獲語言的復雜性和細微差別。隨著模型規模的增加,它們的理解能力和生成文本的質量也會提高,但同時也會增加所需的計算資源和訓練時間。
### `AGI`
AGI(`Artificial General Intelligence`)也稱為通用人工智能,指的是一種具有廣泛智能的機器,能夠理解、學習和應用知識,并能夠在寬廣范圍的環境和任務中進行自主學習、推理、適應和創造,與人類智能相似或等同的水平。
區別于目前廣泛應用的專業人工智能(AI)系統,這些系統通常優化和設計用來解決特定問題(如圖像識別、語言翻譯等),AGI能夠跨領域工作,不僅局限于一個具體領域或任務。
AGI的實現將標志著一個重大科技進展,但同時也引發了許多倫理和安全的考量。目前AGI仍然是人工智能領域的一個長期目標,并且尚未實現。
### `AIGC`
AIGC(`Artificial Intelligence Generated Content`)即為人工智能生成內容,是一種內容生產形式。例如AI文字續寫,文字轉像的AI圖、AI主持人等,都屬于AIGC的應用。
### AI Agent
`AI Agent` 即智能代理,是一種基于人工智能技術的軟件實體,它能夠在一定的環境下自主感知信息、處理數據、并采取行動以實現特定目標。這種智能代理能夠模擬人類的工作和思考方式,通過類似人類的獨立思考和行動來完成一系列簡單或復雜的任務。
大語言模型 (`LLM`) 僅限于它們所訓練的知識,并且這些知識很快就會過時(每天用最新信息重新訓練這么大的模型是不可行的),`LLM`的一些局限主要包括:
* 會產生幻覺
* 結果并不總是真實的
* 對時事的了解有限或一無所知
* 很難應對復雜的計算。
這就是`AI Agent`的用武之地,它可以利用外部工具來克服這些限制。可以將`Agent`視為人工智能大腦或`LLM`操作系統,它使用`LLM`進行推理、計劃和采取行動。
### 智能體 `Bot`
是平臺對`AI Agent`的抽象定義,即人工智能代理,是一個能夠根據人類目標自主思考和規劃任務的程序或實體。可以將智能體視為人工智能大腦或`LLM`操作系統,它使用`LLM`進行推理、計劃和采取行動(調用工具)。
實際使用過程中,我們更建議為某個具體的應用場景創建專門的智能體,而不是什么工作都交給同一個智能體,只有讓智能體做更專注的事情才能做的更加專業。
### 提示詞 `Prompt`
簡單的理解它是給 AI 模型的指令。它可以是一個問題、一段文字描述,甚至可以是帶有一堆參數的文字描述。AI 模型會基于 prompt 所提供的信息,生成對應的文本或者圖片。
針對智能體的提示詞可能和對話的提示詞略有不同,對話過程中的提示詞上下文最多只有5條,智能體的編排提示詞可以一直生效,而且通常具有一定的格式規范,更利于智能體執行任務。平臺也預設了一些常用的智能體提示詞可供用戶選擇。
### `RAG`
RAG(`Retrieval-Augmented Generation 檢索增強生成`)是一種結合了信息檢索和文本生成技術的自然語言處理方法,它通過檢索相關信息來輔助生成更準確和豐富的文本輸出。
RAG的一個關鍵優勢是它可以有效地處理那些不僅依賴于通用知識,而且還需要特定信息源或文檔中的知識才能回答的問題。通過直接利用這些來源中的信息,RAG能夠提供更加準確和信息含量更高的輸出。
### 知識庫 `Knowledge Base`
知識庫指用于提供信息檢索支持的大規模數據集合,包括用戶上傳到平臺的各類文檔、表格、數據表等資料,便于用戶組織、管理領域知識,知識庫可以理解為數據源。
知識庫在RAG方案中的作用是多方面的:
* **信息源**:為生成模型提供豐富的背景信息和事實依據,使生成內容更加豐富和準確。
* **提升效率**:通過預先建立的知識庫進行檢索,可以減少生成模型需要從頭計算或推理的信息量,提升處理速度和效率。
* **增強準確性和相關性**:基于檢索到的與查詢直接相關的信息,生成的內容更加貼近用戶的實際需求,提升了回答的準確性和相關性。
因此,在RAG方案中,知識庫的構建和質量直接影響到系統的整體性能,包括生成內容的準確度、豐富性和用戶滿意度。
### 多模態 `Multi Modal`
多模態指的是結合使用兩種或兩種以上不同類型的模式或信號來進行信息的表達、交流或處理。在計算機科學和人工智能領域,多模態通常涉及到結合文本、圖像、音頻、視頻以及其他傳感器數據來提升算法的理解、分析和生成能力。
多模態方法可以幫助系統更全面地理解復雜的信息場景,提高信息處理的效率和效果。
### 多路召回 `Multi-channel Recall`
多路召回是自然語言處理(NLP)和推薦系統中的一種常見策略,旨在從多個維度或渠道同時檢索信息或物品,以提高召回質量和覆蓋率。在這種策略中,系統會利用多個獨立的算法或模型,每個算法或模型專注于從一個特定的角度或依據一個特定的特征來檢索信息。
這些不同的召回渠道之后可以被合并或進一步處理,以生成一個綜合的、多樣化的結果集,從而提高最終推薦或檢索結果的準確性和多樣性。多路召回在提升用戶體驗和滿足不同用戶需求方面發揮著重要作用。
### 微調 `Fine-Tuning`
模型微調(`Model Fine-tuning`)是一種機器學習方法,特別是在深度學習領域中常見。這種方法涉及到在一個預訓練的模型基礎上,通過對模型進行額外的訓練(或“微調”),使其更好地適應于特定任務或數據集。在模型微調過程中,通常會采用較小的學習率,對預訓練模型的權重進行小幅度調整,以達到提高模型在特定任務上表現的目的。
模型微調的特點是能夠利用預訓練模型已經學到的知識,從而在數據量較少的情況下也能達到較好的性能,加速模型的訓練過程并提高模型的泛化能力。
### 對齊`Alignment`
人工智能中的對齊是指引導人工智能系統的行為,使其符合設計者的利益和預期目標。一個已對齊的人工智能的行為會向著預期方向發展;而未對齊的人工智能的行為雖然也具備特定目標,但此目標并非設計者所預期。
### Token
在自然語言處理中,我們通常將文本拆分為一個個離散的token,以便于計算機理解和處理在GPT模型中,token是模型接收的最小單位。模型在訓練和生成文本時,將輸入的文本序列劃分為一系列的token,并通過對這些token進行處理和分析來生成響應。
例如:在一個對話中,一句話可以被劃分為多個token,包括單詞、標點符號等。每個token都有一個對應的編碼表示,通常是一個整數。這些編碼將文本轉換為模型能夠處理的數值形式。在使用ChatGPT時,用戶通常需要了解自己的輸入文本中有多少個token,以確保不超過模型的最大輸入限制。
需要注意的是,不同的模型和工具可能對token的定義和處理方式有所不同但總體來說token是指文本處理和分析的最小單位,通常1Token的內容為5 字節的文本,但由于字符編碼問題,不同中文字符的token數量并不是固定的,一般通過類OpenAI的接口調用會返回當前內容的token數量大小。
### 向量 `Vector`
向量,物理、工程等也稱作矢量、歐幾里得向量(`Euclidean vector`) 是數學、物理學和工程科學等多個自然科學中的基本概念。指一個同時具有大小和方向,且滿足平行四邊形法則的幾何對象。理論數學中向量的定義為任何在稱為向量空間的代數結構中的元素。
一般地,同時滿足具有大小和方向兩個性質的幾何對象即可認為是向量。向量常常在以符號加箭頭標示以區別于其它量。與向量相對的概念稱標量、純量、數量,即只有大小、絕大多數情況下沒有方向(電流是特例)、不滿足平行四邊形法則的量。
### 向量數據庫 `Vector Database`
向量數據庫是基于智能算法提取需存儲內容的特征,轉變成具有大小定義、特征描述、空間位置的多維數值進行向量化存儲的數據庫,使內容不僅可被存儲,同時可被智能檢索與分析。
### 工具 `Tool`
是平臺對智能體能力的抽象,通過工具的配置和組合可以實現多種業務場景需求,工具可以被實際關聯到智能體的擴展能力,目前平臺提供的工具包括大模型能力(文生圖等)、聯網查詢(必應搜索)、知識庫檢索(知識管理檢索)、函數調用(各種接口)等類型,將來還會拓展更多的工具類型。
- 設計模式系列
- 工廠方法模式
- 序言
- Windows程序注冊為服務的工具WinSW
- 基礎
- 安裝
- 開發規范
- 目錄結構
- 配置
- 快速入門
- 架構
- 請求流程
- 架構總覽
- URL訪問
- 容器和依賴注入
- 中間件
- 事件
- 代碼層結構
- 四個層次
- 路由
- 控制器
- 請求
- 響應
- 數據庫
- MySQL實時同步數據到ES解決方案
- 阿里云DTS數據MySQL同步至Elasticsearch實戰
- PHP中的MySQL連接池
- PHP異步非阻塞MySQL客戶端連接池
- 模型
- 視圖
- 注解
- @SpringBootApplication(exclude={DataSourceAutoConfiguration.calss})
- @EnableFeignClients(basePackages = "com.wotu.feign")
- @EnableAspectJAutoProxy
- @EnableDiscoveryClient
- 錯誤和日志
- 異常處理
- 日志處理
- 調試
- 驗證
- 驗證器
- 驗證規則
- 擴展庫
- 附錄
- Spring框架知識體系詳解
- Maven
- Maven和Composer
- 構建Maven項目
- 實操課程
- 01.初識SpringBoot
- 第1章 Java Web發展史與學習Java的方法
- 第2章 環境與常見問題踩坑
- 第3章 springboot的路由與控制器
- 02.Java編程思想深度理論知識
- 第1章 Java編程思想總體
- 第2章 英雄聯盟的小案例理解Java中最為抽象的概念
- 第3章 徹底理解IOC、DI與DIP
- 03.Spring與SpringBoot理論篇
- 第1章 Spring與SpringBoot導學
- 第2章 Spring IOC的核心機制:實例化與注入
- 第3章 SpringBoot基本配置原理
- 04.SprinBoot的條件注解與配置
- 第1章 conditonal 條件注解
- 第2章 SpringBoot自動裝配解析
- 05.Java異常深度剖析
- 第1章 Java異常分類剖析與自定義異常
- 第2章 自動配置Url前綴
- 06.參數校驗機制與LomBok工具集的使用
- 第1章 LomBok工具集的使用
- 第2章 參數校驗機制以及自定義校驗
- 07.項目分層設計與JPA技術
- 第1章 項目分層原則與層與層的松耦合原則
- 第2章 數據庫設計、實體關系與查詢方案探討
- 第3章 JPA的關聯關系與規則查詢
- 08.ORM的概念與思維
- 第1章 ORM的概念與思維
- 第2章 Banner等相關業務
- 第3章 再談數據庫設計技巧與VO層對象的技巧
- 09.JPA的多種查詢規則
- 第1章 DozerBeanMapper的使用
- 第2章 詳解SKU的規格設計
- 第3章 通用泛型Converter
- 10.令牌與權限
- 第1章 通用泛型類與java泛型的思考
- 常見問題
- 微服務
- demo
- PHP中Self、Static和parent的區別
- Swoole-Cli
- 為什么要使用現代化PHP框架?
- 公眾號
- 一鍵部署微信公眾號Markdown編輯器(支持適配和主題設計)
- Autodesigner 2.0發布
- Luya 一個現代化PHP開發框架
- PHPZip - 創建、讀取和管理 ZIP 文件的簡單庫
- 吊打Golang的PHP界天花板webman壓測對比
- 簡潔而強大的 YAML 解析庫
- 推薦一個革命性的PHP測試框架:Kahlan
- ServBay下一代Web開發環境
- 基于Websocket和Canvas實現多人協作實時共享白板
- Apipost預執行腳本如何調用外部PHP語言
- 認證和授權的安全令牌 Bearer Token
- Laradock PHP 的 Docker 完整本地開發環境
- 高效接口防抖策略,確保數據安全,避免重復提交的終極解決方案!
- TIOBE 6月榜單:PHP穩步前行,編程語言生態的微妙變化
- Aho-Corasick字符串匹配算法的實現
- Redis鍵空間通知 Keyspace Notification 事件訂閱
- ServBay如何啟用并運行Webman項目
- 使用mpdf實現導出pdf文件功能
- Medoo 輕量級PHP數據庫框架
- 在PHP中編寫和運行單元測試
- 9 PHP運行時基準性能測試
- QR碼生成器在PHP中的源代碼
- 使用Gogs極易搭建的自助Git服務
- Gitea
- webman如何記錄SQL到日志?
- Sentry PHP: 實時監測并處理PHP應用程序中的錯誤
- Swoole v6 Alpha 版本已發布
- Proxypin
- Rust實現的Redis內存數據庫發布
- PHP 8.4.0 Alpha 1 測試版本發布
- 121
- Golang + Vue 開發的開源輕量 Linux 服務器運維管理面板
- 內網穿透 FRP VS Tailscale
- 新一代開源代碼托管平臺Gitea
- 微服務系列
- Nacos云原生配置中心介紹與使用
- 輕量級的開源高性能事件庫libevent
- 國密算法
- 國密算法(商用密碼)
- GmSSL 支持國密SM2/SM3/SM4/SM9/SSL 密碼工具箱
- GmSSL PHP 使用
- 數據庫
- SQLite數據庫的Web管理工具
- 阿里巴巴MySQL數據庫強制規范
- PHP
- PHP安全測試秘密武器 PHPGGC
- 使用declare(strict_types=1)來獲得更健壯的PHP代碼
- PHP中的魔術常量
- OSS 直傳阿里騰訊示例
- PHP源碼編譯安裝APCu擴展實現數據緩存
- BI性能DuckDB數據管理系統
- 為什么別人可以是架構師!而我卻不是?
- 密碼還在用 MD5 加鹽?不如試試 password_hash
- Elasticsearch 在電商領域的應用與實踐
- Cron 定時任務入門
- 如何動態設置定時任務!而不是寫死在Linux Crontab
- Elasticsearch的四種查詢方式,你知道多少?
- Meilisearch vs Elasticsearch
- OpenSearch vs Elasticsearch
- Emlog 輕量級開源博客及建站系統
- 現代化PHP原生協程引擎 PRipple
- 使用Zephir編寫C擴展將PHP源代碼編譯加密
- 如何將PHP源代碼編譯加密,同時保證代碼能正常的運行
- 為什么選擇Zephir給PHP編寫動態擴展庫?
- 使用 PHP + XlsWriter實現百萬級數據導入導出
- Rust編寫PHP擴展
- 阿里云盤開放平臺對接進行文件同步
- 如何構建自己的PHP靜態可執行文件
- IM后端架構
- RESTful設計方法和規范
- PHP編譯器BPC 7.3 發布,成功編譯ThinkPHP8
- 高性能的配置管理擴展 Yaconf
- PHP實現雪花算法庫 Snowflake
- PHP官方現代化核心加密庫Sodium
- pie
- 現代化、精簡、非阻塞PHP標準庫PSL
- PHP泛型和集合
- 手把手教你正確使用 Composer包管理
- JWT雙令牌認證實現無感Token自動續期
- 最先進PHP大模型深度學習庫TransformersPHP
- PHP如何啟用 FFI 擴展
- PHP超集語言PXP
- 低延遲雙向實時事件通信 Socket.IO
- PHP OOP中的繼承和多態
- 強大的現代PHP高級調試工具Kint
- PHP基金會
- 基于webman+vue3高質量中后臺框架SaiAdmin
- 開源免費的定時任務管理系統:Gocron
- 簡單強大OCR工具EasyOCR在PHP中使用
- PHP代碼抽象語法樹工具PHP AST Viewer
- MySQL數據庫管理工具PHPMyAdmin
- Rust編寫的一款高性能多人代碼編輯器Zed
- 超高性能PHP框架Workerman v5.0.0-beta.8 發布
- 高并發系列
- 入門介紹及安裝
- Lua腳本開發 Hello World
- 執行流程與階段詳解
- Nginx Lua API 接口開發
- Lua模塊開發
- OpenResty 高性能的正式原因
- 記一次查找 lua-resty-mysql 庫 insert_id 的 bug
- 包管理工具OPM和LuaRocks使用
- 異步非阻塞HTTP客戶端庫 lua-resty-http
- Nginx 內置綁定變量
- Redis協程網絡庫 lua-resty-redis
- 動態HTML渲染庫 lua-testy-template
- 單獨的
- StackBlitz在線開發環境
- AI
- 基礎概念
- 12312
- 基礎鏡像的坑
- 利用phpy實現 PHP 編寫 Vision Transformer (ViT) 模型
- 語義化版本 2.0.0