2025-08-06 11:25:34

Pour que les grands modèles deviennent intelligents, il faut que les humains enseignent et gèrent - c'est ce qu'on appelle le Human-in-the-loop RL.

Récemment, j'ai effectué une tâche sur @JoinSapien, qui consistait à examiner un processus de raisonnement écrit par une IA :

🌱 Comment l'IA pense-t-elle ?
🌱 Est-ce logique ?
🌱 À quel moment cela a-t-il commencé à dérailler ?

Cette tâche s'appelle évaluation CoT (Chain-of-Thought), je suis son auditeur logique.

En allant plus loin, il y a l'Arbre des Pensées, où l'IA essaiera plusieurs branches d'idées, et les humains sélectionneront le meilleur chemin.

En fait, vous pouvez considérer que vous parlez à un enfant, mais cet enfant a un cerveau futuriste de niveau GPT.

Ce travail, l'IA ne peut pas le faire seule, une personne doit participer.

@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol

TREE-6.92%

GPT-4.69%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Partager

Commentaire

0/400

Aucun commentaire

Rubrique
#Show My Alpha Points
57k Popularité
#ETH Whales Accumulate
5k Popularité
#Fed Officials Signal Rate Cut
4k Popularité
#SOL Futures Reach New High
21k Popularité
#ETH ETF Sees 12 Weeks of Inflows
7k Popularité

Épingler