31 octombrie 2023
Nazneen Rajani, HuggingFace
A existat o mulțime de muncă în instruirea agenților conversaționali utili, folosind modele lingvistice mari (LLM). Aceste modele se bazează pe diverse seturi de date, inclusiv depozite open-source, date private și chiar date sintetice generate din LLM-uri precum GPT-4. Cu toate acestea, curatarea seturilor de date pentru reglarea fină supravegheată implică decizii critice, cum ar fi definirea distribuțiilor de sarcini, volumul de date, lungimea promptului și multe altele. În timp ce cercetările anterioare subliniază importanța calității datelor, impactul nuanțat al acestor diferiți factori de seturi de date asupra performanței modelului rămâne neclar. În această discuție, voi prezenta abordarea noastră pentru curatarea datelor pentru reglarea fină supravegheată și învățare prin consolidare pentru feedback uman (RLHF) în contextul antrenării chatbot-urilor utile. În continuare, voi aprofunda în rezultatele experimentelor care luminează efectele nuanțate ale diferitelor atribute ale setului de date asupra procesului de instruire a utilității în chatbot. În cele din urmă, voi oferi o privire de ansamblu asupra stării actuale a metodologiilor de evaluare a chatbot și voi evidenția provocările existente care modelează acest domeniu în evoluție.
Mai multe despre curs puteți găsi aici: https://web.stanford.edu/class/cs25/
Vizualizați întreaga listă de redare CS25 Transformers United: https://www.youtube.com/playlist?list=PLoROMvodv4rNiJRchCzutFw5ItR_Z27CM
Cursuri interesante:
- Învățare profundă aplicată cu PyTorch – Curs complet
- Analiza datelor cu Python pentru utilizatorii Excel – Curs complet
- Stanford CS25: V3 I Inteligență încorporată de nivel scăzut cu modele de bază
- Certificare Azure AI Fundamentals 2024 (AI-900) – Curs complet pentru a promova examenul
- Certificare Azure AI Fundamentals (AI-900) – Curs complet pentru a promova examenul
- Cursuri Proiectarea, Realizarea Si Administrarea Bazelor De Date
- Stanford CS25: paradigma V1 I Mixture of Experts (MoE) și Switch Transformer
- Curs de analiză și vizualizare a datelor Python – Date astronomice
- Creați aplicații AI cu ChatGPT, DALL-E și GPT-4 – Curs complet pentru începători
- Tutorial de matematică pentru programatori – Curs complet despre seturi și logică