La IA impulsa a los seres digitales a "volar hacia los hogares comunes".

Desde que abrió sus puertas en abril de 2025, el Pabellón de China en la Exposición Mundial de Osaka, Japón, ha atraído a numerosos visitantes para su "Presencia diaria". Al entrar en el Pabellón de China, se puede escuchar a lo lejos un grito de "俺老孙来也". Este sonido proviene del "AI Sun Wukong" desarrollado por iFlytek Co., Ltd. (en adelante, "iFlytek"), que domina los idiomas chino, japonés e inglés, y cuya apariencia y tono de voz replican al icónico personaje de la película de animación clásica "El Rey Mono".

"AI Sun Wukong" detrás de él, está la tecnología de los humanos digitales que ha crecido rápidamente en los últimos años. Como un punto de conexión clave para nuevas industrias emergentes como la IA y el metaverso, el papel de los humanos digitales en el desarrollo de la economía digital se vuelve cada vez más importante. Con la aplicación profunda de la tecnología de grandes modelos en este campo, los humanos digitales están avanzando gradualmente de ser "utilizables" a "fáciles de usar", impulsando a las industrias relacionadas hacia una nueva etapa de desarrollo.

Formar tres grandes categorías de escenarios de aplicación

Los humanos digitales son entidades digitales inteligentes creadas a través de varias tecnologías digitales como el modelado. Tienen una apariencia humana, voz y lenguaje, pueden simular movimientos corporales, poseen capacidad de pensamiento y pueden realizar funciones como aprendizaje, generación e interacción, respaldados por un gran modelo.

Con el impulso de la tecnología y la demanda, el ecosistema de la industria de los humanos digitales en nuestro país se está perfeccionando cada vez más, la escala de aplicación se está expandiendo constantemente y las capacidades de producción, operación y servicio en la cadena industrial están mejorando gradualmente. Según los datos de Tianyancha, hasta 2024, el número de empresas relacionadas con humanos digitales en nuestro país ha alcanzado 1.144 millones, y solo en los primeros cinco meses de 2024 se han registrado más de 174,000 nuevas empresas, lo que demuestra el potencial y la vitalidad del mercado de la industria de los humanos digitales.

En opinión de Wu Suoning, miembro del Comité Consultivo de Expertos de la Asociación de Internet de China, para evitar que la tecnología de los humanos digitales se quede en una mera formalidad y cause un desperdicio de recursos, es necesario encontrar salidas de aplicación, promoviendo la aplicación de los humanos digitales de manera integral.

Con la aplicación como guía, la industria de los humanos digitales está acelerando la construcción de un ecosistema cerrado de "tecnología - escenario - negocio".

La "Informe sobre el desarrollo de personas digitales en China (2024)" publicado por la Asociación de Internet de China (en adelante, el "Informe") analiza que los escenarios de aplicación de personas digitales se han formado preliminarmente en tres categorías: personas digitales mediáticas, personas digitales de servicio y personas digitales de industria. Entre ellas, las personas digitales mediáticas son la forma de aplicación de personas digitales más madura en la actualidad. La proporción de escenarios generados en torno a las personas digitales mediáticas puede alcanzar el 50%, y su imagen realista y expresión lingüística fluida han mejorado enormemente la interactividad y el interés de la difusión de información.

Por ejemplo, en el "Show de Ciencia y Tecnología de Nochevieja" lanzado por la Radio y Televisión Central de China por primera vez el año pasado, el "Festival de Innovación Científica y Tecnológica de China", hubo una escena en la que el anfitrión Zhang Tengyue y el "clon de IA" se encontraban en el mismo escenario. Este "host de IA" basado en la plataforma inteligente iFLYTEK de iFLYTEK no solo tiene la misma voz, expresiones y movimientos que el anfitrión real, sino que también puede comunicarse con el anfitrión con calma, comprender con precisión las palabras de la otra parte y responder de manera rápida y adecuada, y la fluidez de la interacción dificulta que la audiencia distinga entre lo real y lo falso.

Según el informe, además de los humanos digitales de los medios, los humanos digitales de servicio también se han actualizado de manera integral, con capacidades de interacción más sólidas, y el número de escenarios representa el 30%, que se usa ampliamente en asuntos gubernamentales, comercio electrónico, finanzas y otros campos; Los humanos digitales de la industria han comenzado a brotar, con un número de escenarios que representa el 20%, desempeñando gradualmente un papel en la atención médica, la educación y la gestión empresarial.

Se espera que se convierta en la entrada a la innovación de IA

Los avatares digitales han pasado por tres etapas: de ser impulsados por personas reales a ser impulsados por programas, y ahora a ser impulsados por IA.

Los primeros avatares digitales impulsados por humanos, aunque podían presentar imágenes digitales virtuales, dependían principalmente de técnicas como el modelado por gráficos por computadora y la captura de movimiento, requiriendo la provisión de grandes cantidades de datos de lenguaje y movimiento por parte de personas reales. Los avatares digitales impulsados por programas ya no necesitan que humanos proporcionen datos de lenguaje y movimiento, pero se basan en programas de computadora fijos, acercándose más a un "robot digital" y no pueden lograr un efecto humanizado de alta fidelidad. En los últimos años, los avatares digitales impulsados por IA no solo presentan un mayor realismo en los detalles como la narración de voz y las expresiones de movimiento, sino que también han ido adquiriendo gradualmente capacidades de interacción y pensamiento más potentes.

"Hace unos años, los humanos digitales podían tener problemas como la falta de coincidencia en la forma de los labios y las expresiones, así como movimientos rígidos. Esto se debe a que los humanos digitales no comprenden adecuadamente el significado del texto, y sus expresiones y movimientos dependen en gran medida de recursos preestablecidos limitados, lo que les impide coincidir con precisión con el contenido del texto." Dijo Gao Jingwen, responsable del negocio de humanos digitales de iFlytek, quien añadió que, con la aplicación profunda de la tecnología de modelos grandes en el campo de los humanos digitales, el rendimiento de los productos de humanos digitales ha alcanzado un nuevo nivel.

Por ejemplo, en octubre del año pasado, iFLYTEK lanzó un humano digital super-antropomórfico. Se basa en la generación de difusión multimodo de modelos de gran tamaño, que pueden generar movimientos corporales en tiempo real de acuerdo con el ritmo, la entonación y el contenido del habla, rompiendo las limitaciones de las plantillas preestablecidas de acción y mejorando en gran medida la expresividad de los humanos digitales en escenas dinámicas. El humano digital Zhiying de Tencent puede lograr la "clonación de imágenes" y la "clonación de sonido", los usuarios solo necesitan cargar una pequeña cantidad de imágenes, videos y materiales de audio, y pueden generar rápidamente sus propios clones humanos digitales y personalizar su timbre. El humano digital de IA de código abierto de Alibaba, EchoMimic, puede dar un habla y una expresión vívidas a las imágenes estáticas.

"En resumen, la tecnología de modelos grandes no solo permite que los humanos digitales comprendan verdaderamente el significado, sino que también les permite generar rápidamente las acciones y expresiones correspondientes basadas en su comprensión del texto, logrando así una representación vívida." Dijo Gao Jingwen.

El presidente de la Asociación de Internet de China, Shang Bing, considera que los humanos digitales están convirtiéndose en la puerta de entrada activa para la aplicación de la IA, con un fuerte grado de conexión, integración y fusión con industrias como los grandes datos, los terminales inteligentes y la inteligencia encarnada, lo que podría convertirlos en una de las interfaces interactivas activas de la próxima generación de Internet. Es necesario prestar atención a la práctica de la implementación de aplicaciones innovadoras, explorar activamente nuevos formatos emergentes como los humanos digitales y acelerar la formación de ventajas de aplicaciones a gran escala.

武锁宁 también considera que los humanos digitales son la puerta de entrada a la aplicación de la IA y la innovación de la IA. Los humanos digitales impulsados por IA tienen el potencial de traer aplicaciones más ricas y diversas a diversas industrias, y estas aplicaciones pueden precisamente guiar a la IA hacia un camino de desarrollo pragmático.

Crear un "doble digital" personalizado

Con la amplia aplicación de los humanos digitales, muchos escenarios han planteado mayores exigencias para los humanos digitales.

"Por ejemplo, escenarios como la transmisión en vivo de comercio electrónico y las preguntas y respuestas de servicio al cliente plantean requisitos extremadamente altos para la capacidad de interacción en tiempo real de los humanos digitales. Los humanos digitales no solo deben ser capaces de mantener conversaciones en tiempo real con los usuarios, sino también de generar las acciones y expresiones correspondientes según el contenido del diálogo, de lo contrario afectará a la eficiencia del procesamiento empresarial y afectará directamente a la experiencia del usuario. Gao Jingwen presentó que para mejorar la eficiencia del modelo de generación de video humano digital, el equipo de la compañía ha desarrollado una tecnología de extracción de representación de acción, que convierte la entrada de voz y texto en representaciones intermedias compactas, comprimiendo efectivamente la dimensión de video. Con la ayuda de esta tecnología, el sistema puede extraer rápidamente información clave del texto y la voz de entrada como un taquígrafo, reducir la cantidad de datos de información irrelevantes y generar videos en consecuencia, mejorando en gran medida la eficiencia de la generación de videos y asegurando la interacción en tiempo real entre los humanos digitales y los usuarios.

También debe tenerse en cuenta que, aunque la industria humana digital se está desarrollando rápidamente, todavía se encuentra en un período de rápido crecimiento. Gao Jingwen cree que, en la actualidad, existe un fenómeno de homogeneización de los productos humanos digitales, y la personalización y la personalización se convertirán en una importante dirección de desarrollo de la industria humana digital en el futuro. Con el desarrollo de la tecnología de IA generativa, el umbral de producción y el costo de los humanos digitales se han reducido rápidamente, la eficiencia de la producción y la diversidad de contenido se han mejorado significativamente, y se ha convertido en una realidad para los usuarios crear productos humanos digitales más personalizados de acuerdo con sus propias características. Ahora, se puede generar un humano digital superantropomórfico personalizado con solo una foto, una grabación de una oración y otros materiales, lo que simplifica en gran medida los requisitos de materiales preestablecidos para la personalización humana digital y optimiza la ruta de operación del usuario.

Ga Jingwen también admitió que, aunque la tecnología de modelos grandes está impulsando a los humanos digitales a "volar hacia los hogares comunes", aún se necesita una gran cantidad de alimentación de datos y entrenamiento interactivo para lograr efectos más refinados. Además, los problemas que surgen, como la filtración de privacidad y la seguridad de los datos, no deben ser ignorados.

"Es posible que en el futuro cada uno de nosotros tenga un 'doble digital', que puede ayudarnos a manejar el trabajo, responder las dudas de la vida y convertirse en nuestra compañía", dijo Gao Jingwen.

(Fuente: Diario de Ciencia y Tecnología)

Fuente: Eastmoney

Autor: Diario de Tecnología

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)