大模型時(shí)代
企業(yè)對(duì)人才的需求,變了 !

算法工程師 招聘被大模型方向主導(dǎo),薪資遠(yuǎn)超傳統(tǒng)算法崗位

  • 崗位要求
  • 工作職責(zé)

1. 熟練掌握Llama/GPT/BLOOM等大模型原理并具有實(shí)際落地經(jīng)驗(yàn)
2. 對(duì)NLP大模型的技術(shù),包括GPT、Instruction Tuning等有較為深入的了解和實(shí)踐
3. 對(duì)常見(jiàn)大模型,如Llama/GPT/BART等技術(shù)實(shí)現(xiàn)和落地有實(shí)際經(jīng)驗(yàn)
4. 熟練掌握GPT或其他大模型的等算法訓(xùn)練范式
5. 具備NLP大模型訓(xùn)練經(jīng)驗(yàn)者優(yōu)先
6. 參與或者領(lǐng)到過(guò)大型預(yù)訓(xùn)練大模型落地項(xiàng)目
7. 在NLP文本生成或大模型預(yù)訓(xùn)練方向有較深入研究
8. 對(duì)模型量化、性能優(yōu)化有一定的了解

1. 從事大語(yǔ)言模型(LLM)預(yù)訓(xùn)練算法研究、訓(xùn)練、應(yīng)用
2. 負(fù)責(zé)自然語(yǔ)言處理(NLP)方向基于GPU的并行多機(jī)多卡訓(xùn)練、高性能模型推理等
3. 參與研發(fā)預(yù)訓(xùn)練大模型等下一代人工智能核心技術(shù)
4. 基于海量對(duì)話數(shù)據(jù),負(fù)責(zé)探索ChatGPT相關(guān)算法研究
5. 負(fù)責(zé)公司垂域智能對(duì)話算法開(kāi)發(fā)
6. 跟蹤與探索NLP業(yè)界前沿技術(shù),具有快速?gòu)?fù)現(xiàn)及落地的能力
7. 前沿技術(shù)跟進(jìn)研究,支持公司通用類和垂類預(yù)訓(xùn)練模型研發(fā)及效果持續(xù)優(yōu)化
8. 優(yōu)化大模型finetune性能,線上實(shí)時(shí)inference性能

GPT-4 拉開(kāi)“通用人工智能 (AGI) ”序幕,算法領(lǐng)域邁入 “大模型” 時(shí)代

  • ChatGPT 的推出席卷全球科技行業(yè),徹底顛覆人們對(duì)于傳統(tǒng)AI行業(yè)和 技術(shù)的認(rèn)知
  • GPT-4 繼續(xù) GPT 系列神話,在語(yǔ)言、數(shù)學(xué)、編程、視覺(jué)、醫(yī)學(xué)、法律和心理學(xué)領(lǐng)域表現(xiàn)出色,接近人類水平
  • 鑒于 GPT 系列模型巨大的應(yīng)用潛力和市場(chǎng)價(jià)值,國(guó)內(nèi)頭部互聯(lián)網(wǎng)公司迅速跟進(jìn),先后推出了“文言一心”、“通義千問(wèn)”、“日日新”等中文領(lǐng)域大語(yǔ)言模型
  • 大模型開(kāi)源社區(qū)異?;钴S,短時(shí)間內(nèi)推出多個(gè)性能比肩 GPT 系列模型的開(kāi)源大模型
  • 大廠公司高管及投資人紛紛下場(chǎng)創(chuàng)業(yè),傳統(tǒng)互聯(lián)網(wǎng)公司紛紛加大大模型方面的投入,AIGC 及大模型領(lǐng)域呈現(xiàn)出前所未有的蓬勃發(fā)展景象
  • AIGC 及大模型領(lǐng)域人才需求井噴,企業(yè)開(kāi)放大量高薪崗位

行業(yè)新鮮時(shí)報(bào)

  • 螞蟻集團(tuán)證實(shí)技術(shù)研發(fā)團(tuán)隊(duì)正在自研語(yǔ)言和多模態(tài)大模型 — “貞儀”。
  • 中科院計(jì)算所推出多語(yǔ)言大模型“百聆”,百聆是一個(gè)以 LLaMA 為基座的遵循指令的 LLM。評(píng)測(cè)實(shí)驗(yàn)表明,百聆使用更少的參數(shù)實(shí)現(xiàn)了與 GPT-3.5-turbo 相當(dāng)?shù)男阅堋?
  • 北大團(tuán)隊(duì)開(kāi)源首個(gè)中文法律大模型 — ChatLaw,并針對(duì)大語(yǔ)言模型和知識(shí)庫(kù)的結(jié)合問(wèn)題給出了法律場(chǎng)景下合理的解決方案。
  • 中國(guó)聯(lián)通發(fā)布圖文大模型“鴻湖圖文大模型1.0”。鴻湖圖文大模型是首個(gè)面向運(yùn)營(yíng)商增值業(yè)務(wù)的大模型,目前擁有8億訓(xùn)練參數(shù)和20億訓(xùn)練參數(shù)兩個(gè)版本,可實(shí)現(xiàn)以文生圖、視頻剪輯、以圖生圖等功能。
  • 由上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)牽頭,并聯(lián)合國(guó)內(nèi)外頂級(jí)科研機(jī)構(gòu)、高校及醫(yī)院共同發(fā)布全球首個(gè)醫(yī)療多模態(tài)基礎(chǔ)模型群“OpenMEDLab浦醫(yī)”。
  • 美圖發(fā)布七大AIGC新品,包括WHEE、開(kāi)拍、WinkStudio、美圖設(shè)計(jì)室2.0、AI數(shù)字人生成工具、RoboNeo美圖AI助手、MiracleVision奇想智能等;
  • 冪律智能聯(lián)合智譜AI發(fā)布基于中文千億大模型的法律垂直大模型—PowerLawGLM。PowerLawGLM 法律大模型,基于智譜目前效果最好的ChatGLM130B通用千億對(duì)話大模型進(jìn)行聯(lián)合研發(fā)。
  • 國(guó)內(nèi)AI準(zhǔn)獨(dú)角獸企業(yè)實(shí)在智能 (Intelligence Indeed) 的自研垂直領(lǐng)域大語(yǔ)言模型—TARS(塔斯) 歷經(jīng)半年研發(fā)后,正式開(kāi)啟內(nèi)測(cè)。
  • 理想汽車在發(fā)布會(huì)上展示了車載大語(yǔ)言模型MindGPT,理想汽車智能空間算法科學(xué)家陳偉博士表示:“我們以大模型MindGPT”為核心,打造了新一代多模態(tài)人機(jī)交互體系,全力支撐空間交互2.0的落地,讓全家人都能輕松使用AI,讓理想同學(xué)成為每一個(gè)家庭的新成員。

培養(yǎng)大模型人才
需要這樣的課程

課程大綱:大廠大牛帶路,直擊大廠標(biāo)準(zhǔn),實(shí)戰(zhàn)貫穿全程

階段一 深度學(xué)習(xí)基礎(chǔ) 點(diǎn)擊收起

核心技術(shù)

  • 深度學(xué)習(xí)基本概念
  • 深度學(xué)習(xí)經(jīng)典模型解析
  • 深度學(xué)習(xí)模型優(yōu)化策略解析
  • 深度學(xué)習(xí)GPU原理與應(yīng)用方法
  • 深度學(xué)習(xí)GPU并行訓(xùn)練策略解析

掌握技能

  • 深度學(xué)習(xí)基本概念
  • Transformer 核心原理
  • BERT 系列模型核心原理
  • T5 模型核心原理
  • 深度學(xué)習(xí)模型優(yōu)化策略
  • GPU架構(gòu)原理與CUDA編程原理
  • GPU在深度學(xué)習(xí)訓(xùn)練/推理過(guò)程中的應(yīng)用
  • GPU多卡并行技術(shù)

項(xiàng)目實(shí)戰(zhàn)

深度學(xué)習(xí)模型多GPU訓(xùn)練實(shí)戰(zhàn)
  • 1模型訓(xùn)練流程詳解
  • 2模型訓(xùn)練環(huán)境搭建
  • 3模型 CPU/GPU 訓(xùn)練代碼開(kāi)發(fā)
  • 4模型 多GPU并行訓(xùn)練代碼開(kāi)發(fā)
  • 5模型推理代碼開(kāi)發(fā)
  • 6模型效果評(píng)估與優(yōu)化

課程特點(diǎn)

覆蓋深度學(xué)習(xí)基礎(chǔ)理論,全方位講解深度學(xué)習(xí)基本概念,從經(jīng)典模型出發(fā),深入淺出地講解經(jīng)典模型原理,對(duì)深度學(xué)習(xí)模型優(yōu)化策略、GPU原理、CUDA編碼原理、GPU應(yīng)用方法及GPU多卡加速策略等核心技術(shù)進(jìn)行細(xì)致講解。 通過(guò)算法原理、企業(yè)經(jīng)驗(yàn)及代碼實(shí)踐三位一體的課程安排,帶你進(jìn)入深度學(xué)習(xí)的世界,補(bǔ)齊你在模型理解和應(yīng)用過(guò)程中的短板,讓你更好的掌握深度學(xué)習(xí)基礎(chǔ)技能。

階段二 大模型基礎(chǔ) 點(diǎn)擊展開(kāi)

核心技術(shù)

  • 大模型技術(shù)概述
  • GPT 系列模型核心原理詳解
  • LLaMA 系列模型核心原理詳解
  • BLOOM 系列模型核心原理詳解
  • Baichuan 系列模型核心原理詳解
  • Baichuan 系列模型源碼詳解
  • ChatGLM 系列模型核心原理詳解
  • Qwen 系列模型核心原理講解
  • Langchain 框架核心原理詳解

掌握技能

  • GPT系列模型核心原理(GPT1/GPT2/GPT3/GPT4/InstructGPT)
  • LLaMA系列模型核心原理(LLaMA/LLaMA2/Alpaca/Vicuna/BaiChuan2)
  • 優(yōu)秀開(kāi)源大模型核心原理(BLOOMZ/ChatGLM3/Qwen1.5)
  • 大模型應(yīng)用框架LangChain核心原理

項(xiàng)目實(shí)戰(zhàn)

Langchain + LLM 本地化Agent實(shí)戰(zhàn)
  • 1Langchain六大核心模塊原理詳解與代碼實(shí)現(xiàn)
  • 2Langchain + LLM 本地化Agent系統(tǒng)設(shè)計(jì)
  • 3Langchain + LLM自定義Tools實(shí)現(xiàn)
  • 4Langchain + LLM系統(tǒng)部署
  • 5Langchain + LLM應(yīng)用接入

課程特點(diǎn)

從論文出發(fā),全面覆蓋大模型核心技術(shù)原理,深入淺出的講解大模型相關(guān)技術(shù)、核心模型原理及模型源碼,為之后的大模型實(shí)踐打下堅(jiān)實(shí)的理論基礎(chǔ)。

階段三 多模態(tài)基礎(chǔ) 點(diǎn)擊展開(kāi)

核心技術(shù)

  • 多模態(tài)技術(shù)概述
  • Vit模型核心原理詳解
  • CLIP模型核心原理詳解
  • ALBEF模型核心原理詳解
  • BLIP/BLIP-2模型核心原理詳解
  • LLaVA模型核心原理詳解
  • Qwen-VL模型核心原理詳解

掌握技能

  • 多模態(tài)技術(shù)核心原理
  • 經(jīng)典多模態(tài)模型核心原理(Vit/CLIP/ALBEF/BLIP)
  • 多模態(tài)大模型核心原理(BLIP-2/LLaVA/Qwen-VL)

課程特點(diǎn)

從論文出發(fā),全面覆蓋經(jīng)典多模態(tài)模型及多模態(tài)大模型,深入淺出的講解多模態(tài)相關(guān)技術(shù)。

階段四 大模型微調(diào)基礎(chǔ) 點(diǎn)擊展開(kāi)

核心技術(shù)

  • 大模型微調(diào)概述
  • 大模型微調(diào)核心要素
  • 大模型微調(diào)數(shù)據(jù)收集與評(píng)估
  • 大模型Tuning技術(shù)詳解
  • 大模型PEFT技術(shù)詳解
  • 大模型全參數(shù)微調(diào)技術(shù)詳解
  • 大模型CoT/ToT/GoT/AoT 技術(shù)詳解
  • 大模型 DPO 技術(shù)詳解
  • 大模型內(nèi)容生成技術(shù)詳解

掌握技能

  • 大模型微調(diào)所需的核心要素
  • 大模型微調(diào)的數(shù)據(jù)收集和處理過(guò)程
  • 使用ChatGPT 獲取高質(zhì)量訓(xùn)練數(shù)據(jù)
  • 大模型Tuning技術(shù)核心原理 (Prompt-Tuning/Instruction-Tuning/P-Tuning)
  • 大模型PEFT技術(shù)核心原理
  • 大模型全參數(shù)微調(diào)技術(shù)核心原理(DeepSpeed)
  • 大模型CoT/ToT/GoT/AoT 技術(shù)詳解
  • 大模型DPO技術(shù)核心原理
  • 大模型微調(diào)代碼實(shí)現(xiàn)與參數(shù)配置
  • 通過(guò)大模型微調(diào)解決傳統(tǒng)NLP任務(wù)

項(xiàng)目實(shí)戰(zhàn)

基于常規(guī)NLP任務(wù)的大模型微調(diào)實(shí)戰(zhàn)
  • 1NLP常規(guī)任務(wù)方案設(shè)計(jì)
  • 2大模型訓(xùn)練環(huán)境搭建
  • 3大模型微調(diào)代碼詳解
  • 4大模型微調(diào)參數(shù)詳解
  • 5基于常規(guī)NLP任務(wù)的大模型微調(diào)

課程特點(diǎn)

大模型微調(diào)技術(shù)棧全覆蓋,深入講解所有主流大模型微調(diào)技術(shù),深入講解大模型核心訓(xùn)練代碼,通過(guò)使用大模型完成傳統(tǒng)NLP任務(wù),讓你真正的掌握大模型微調(diào)的整體流程。

階段五 大模型實(shí)戰(zhàn) 點(diǎn)擊展開(kāi)

核心技術(shù)

  • 實(shí)戰(zhàn)項(xiàng)目—基于大模型的可視化AIGC問(wèn)答系統(tǒng)開(kāi)發(fā)
  • AIGC問(wèn)答系統(tǒng)—大模型訓(xùn)練環(huán)境搭建
  • AIGC問(wèn)答系統(tǒng)—大模型數(shù)據(jù)收集與 instruction 設(shè)計(jì)
  • AIGC問(wèn)答系統(tǒng)—通用大模型微調(diào)代碼開(kāi)發(fā)(支持多模型/多框架)
  • AIGC問(wèn)答系統(tǒng)—Baichuan2多GPU LoRA微調(diào)實(shí)現(xiàn)
  • AIGC問(wèn)答系統(tǒng)—Baichuan2多GPU 全參數(shù)微調(diào)實(shí)現(xiàn)
  • AIGC問(wèn)答系統(tǒng)—Qwen1.5多GPU LoRA微調(diào)實(shí)現(xiàn)
  • AIGC問(wèn)答系統(tǒng)—Qwen1.5多GPU 全參數(shù)微調(diào)實(shí)現(xiàn)
  • AIGC問(wèn)答系統(tǒng)—大模型性能評(píng)估體系搭建
  • AIGC問(wèn)答系統(tǒng)—大模型部署與服務(wù)接口開(kāi)發(fā)
  • AIGC問(wèn)答系統(tǒng)—大模型界面化調(diào)用系統(tǒng)開(kāi)發(fā)
  • 項(xiàng)目總結(jié)與答疑

掌握技能

  • 基于大模型的智能對(duì)話系統(tǒng)架構(gòu)
  • 大模型訓(xùn)練的環(huán)境搭建與數(shù)據(jù)收集過(guò)程
  • 支持多種模型多種訓(xùn)練框架的微調(diào)代碼開(kāi)發(fā)
  • 大模型多GPU LoRA/全參數(shù)微調(diào)技巧
  • 大模型評(píng)估策略
  • 大模型訓(xùn)練的完整開(kāi)發(fā)流程
  • 大模型界面化調(diào)用系統(tǒng)

課程特點(diǎn)

從實(shí)戰(zhàn)項(xiàng)目出發(fā),基于企業(yè)應(yīng)用最廣泛的Baichuan2及Qwen1.5,從零搭建基于大模型的AIGC對(duì)話系統(tǒng),讓學(xué)員掌握從環(huán)境搭建、數(shù)據(jù)構(gòu)建、大模型微調(diào)到界面化調(diào)用的整個(gè)過(guò)程,掌握大模型微調(diào)的完整鏈路,并建立界面化的大模型調(diào)用系統(tǒng)。

案例展示

課程講師:AI大廠實(shí)戰(zhàn)型專家

  • 姜夏字節(jié)跳動(dòng)AI算法專家

    從業(yè)7年,先后在字節(jié)跳動(dòng)、VIVO人工智能研究院等公司從事智能對(duì)話、知識(shí)圖譜、大模型應(yīng)用等工作,曾主導(dǎo)研發(fā)面向億級(jí)用戶的智能對(duì)話系統(tǒng)及百億量級(jí)知識(shí)圖譜系統(tǒng),具有深厚的理論積累和豐富的模型應(yīng)用經(jīng)驗(yàn)

  • 劉毅阿里巴巴達(dá)摩院AI高級(jí)算法專家

    先后就職于百度自然語(yǔ)言處理部,阿里巴巴達(dá)摩院,擔(dān)任算法研究員,在ACL/EMNLP/COLING等會(huì)議發(fā)表多篇學(xué)術(shù)文章,并擔(dān)任頂會(huì)審稿人。從事大型語(yǔ)言模型訓(xùn)練及應(yīng)用5年,曾主導(dǎo)百億參數(shù)模型研發(fā)迭代,在自然語(yǔ)言處理,預(yù)訓(xùn)練,強(qiáng)化學(xué)習(xí)方面有豐富的理論及實(shí)戰(zhàn)經(jīng)驗(yàn)

適學(xué)人群

  • 算法工程師

    了解機(jī)器學(xué)習(xí)/深度學(xué)習(xí)基本
    概念的在職算法工程師

  • 在讀大學(xué)生

    相關(guān)專業(yè)的
    在校學(xué)習(xí)大學(xué)生

  • AI愛(ài)好者

    對(duì)人工智能有濃厚的興趣
    想從事相關(guān)工作者

只要你熱愛(ài)學(xué)習(xí),熱愛(ài)編程,改變世界的任務(wù)就會(huì)落在你身上,
一起行動(dòng)起來(lái)吧