Pour que les grands modèles deviennent intelligents, il faut que les humains enseignent et gèrent - c'est ce qu'on appelle le Human-in-the-loop RL.



Récemment, j'ai effectué une tâche sur @JoinSapien, qui consistait à examiner un processus de raisonnement écrit par une IA :

🌱 Comment l'IA pense-t-elle ?
🌱 Est-ce logique ?
🌱 À quel moment cela a-t-il commencé à dérailler ?

Cette tâche s'appelle évaluation CoT (Chain-of-Thought), je suis son auditeur logique.

En allant plus loin, il y a l'Arbre des Pensées, où l'IA essaiera plusieurs branches d'idées, et les humains sélectionneront le meilleur chemin.

En fait, vous pouvez considérer que vous parlez à un enfant, mais cet enfant a un cerveau futuriste de niveau GPT.

Ce travail, l'IA ne peut pas le faire seule, une personne doit participer.

@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol
TREE-6.92%
GPT-4.69%
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)