منذ افتتاح جناح الصين في معرض إكسبو 2025 في أوساكا، اليابان، في أبريل، جذب العديد من الزوار "الحضور اليومي". عندما يدخل الزوار جناح الصين، يمكنهم سماع صوت يقول "俺老孙来也" من بعيد. هذا الصوت يأتي من شركة كودا إكسفاي (المشار إليها فيما يلي بـ "كودا إكسفاي") التي قامت بتطوير "AI سن ووكينغ" الذي يتقن ثلاث لغات: الصينية واليابانية والإنجليزية، والذي تم تصميمه ليشبه الشكل ونغمة الصوت لسن ووكينغ من الفيلم الكلاسيكي المتحرك "دا نانغ تيانغونغ".
خلف "AI سون وو كونغ"، توجد تقنية الأشخاص الرقميين التي تطورت بسرعة في السنوات الأخيرة. كحلقة وصل رئيسية بين الصناعات الناشئة مثل الذكاء الاصطناعي والميتافيرس، تزداد أهمية دور الأشخاص الرقميين في تطوير الاقتصاد الرقمي. مع التطبيق العميق لتقنية النماذج الكبيرة في هذا المجال، ينتقل الأشخاص الرقميون تدريجياً من "قابل للاستخدام" إلى "سهل الاستخدام"، مما يدفع الصناعات المعنية إلى دخول مرحلة جديدة من التطوير.
تشكيل ثلاث فئات من سيناريوهات التطبيق
الإنسان الرقمي هو كيان ذكي رقمي يتم إنشاؤه من خلال نمذجة وتكنولوجيا الذكاء الرقمي المتعددة. إنه يمتلك مظهرًا بشريًا وصوتًا ولغة، قادر على محاكاة الحركات الجسدية، ويتميز بقدرة على التفكير، ويمكنه من خلال دعم النماذج الكبيرة تحقيق التعلم، والتوليد، والتفاعل، وغيرها من الوظائف.
تحت قيادة التكنولوجيا والطلب، تتطور صناعة الأفراد الرقميين في بلادي بشكل متزايد، وتتوسع نطاق تطبيقاتها باستمرار، كما تتزايد قدرات الإنتاج والتشغيل والخدمات في سلسلة الصناعة上下游. تظهر بيانات Tianyancha أنه بحلول عام 2024، بلغ عدد الشركات المرتبطة بالأفراد الرقميين في بلادي 1.144 مليون شركة، وتم تسجيل أكثر من 174,000 شركة جديدة فقط في الأشهر الخمسة الأولى من عام 2024، مما يُظهر إمكانية السوق وحيوية صناعة الأفراد الرقميين.
يعتقد وُسو نينغ، عضو اللجنة الاستشارية لخبراء جمعية الإنترنت الصينية، أنه لتجنب أن تصبح تقنية الإنسان الرقمي مجرد شكل، مما يؤدي إلى هدر الموارد، يجب إيجاد منفذ للتطبيقات، ودفع تطبيقات الإنسان الرقمي من خلال نقاط معينة.
بدافع من التطبيقات، تسارع صناعة الإنسان الرقمي في بناء حلقة مغلقة من "التكنولوجيا - المشهد - الأعمال".
أصدرت جمعية الإنترنت الصينية "تقرير تطوير الأشخاص الرقميين في الصين (2024)" (المشار إليه فيما بعد باسم "التقرير")، الذي يحلل أن تطبيقات الأشخاص الرقميين قد تشكلت حاليًا بشكل أولي إلى ثلاثة فئات رئيسية: الأشخاص الرقميون في الوسائط، الأشخاص الرقميون في الخدمات، والأشخاص الرقميون في الصناعات. من بينها، يعد الأشخاص الرقميون في الوسائط الشكل الأكثر نضجًا لتطبيقات الأشخاص الرقميين في الوقت الحالي. يمكن أن تصل نسبة عدد المشاهدات الناتجة عن الأشخاص الرقميين في الوسائط إلى 50٪، حيث أن صورتهم الواقعية وتعبيراتهم اللغوية السلسة تعزز بشكل كبير من تفاعل المعلومات ونكهتها.
على سبيل المثال ، في "عرض ليلة رأس السنة الجديدة للعلوم والتكنولوجيا" الذي أطلقته الإذاعة والتلفزيون المركزي الصيني لأول مرة العام الماضي - "مهرجان الصين للابتكار في العلوم والتكنولوجيا" ، كان هناك مشهد حيث استضاف المضيف Zhang Tengyue و "استنساخ الذكاء الاصطناعي" على نفس المسرح. هذا "مضيف الذكاء الاصطناعي" المستند إلى منصة iFLYTEK الذكية iFLYTEK لا يمتلك نفس الصوت والتعبيرات والحركات مثل المضيف الحقيقي فحسب ، بل يمكنه أيضا التواصل مع المضيف بهدوء ، وفهم كلمات الطرف الآخر بدقة والاستجابة بسرعة وبشكل مناسب ، كما أن طلاقة التفاعل تجعل من الصعب على الجمهور التمييز بين الحقيقي والمزيف.
تظهر "التقرير" أنه بالإضافة إلى الأفراد الرقميين الوسائط، حقق الأفراد الرقميون في الخدمات أيضًا ترقية شاملة، حيث يمتلكون قدرة تفاعلية أقوى، وتصل نسبة عدد المشاهدات إلى 30٪، ويستخدمون على نطاق واسع في مجالات الحكومة والتجارة الإلكترونية والمالية؛ بينما بدأ الأفراد الرقميون في الصناعة في الظهور، حيث تصل نسبة عدد المشاهدات إلى 20٪، وبدءوا تدريجياً في لعب دور في الرعاية الصحية والتعليم وإدارة الأعمال.
من المتوقع أن تصبح مدخل الابتكار في الذكاء الاصطناعي
لقد مرت الشخصيات الرقمية بثلاث مراحل رئيسية: من القيادة البشرية إلى القيادة البرمجية، ثم إلى القيادة بواسطة الذكاء الاصطناعي في الوقت الحاضر.
في البداية، كان الشخص الرقمي المدعوم من البشر قادرًا على تقديم صورة رقمية افتراضية، لكنه كان يعتمد بشكل رئيسي على تقنيات نمذجة الرسوميات الحاسوبية والتقاط الحركة، حيث كان يتطلب دعمًا كبيرًا من البشر لتوفير كميات هائلة من البيانات اللغوية والحركية. بينما يمكن للشخص الرقمي المدعوم من البرامج ألا يعتمد على البشر لتوفير البيانات اللغوية والحركية، إلا أنه يعتمد على برنامج حاسوبي ثابت، مما يجعله أقرب إلى "روبوت رقمي"، ولا يمكنه تحقيق تأثيرات إنسانية عالية الدقة. في السنوات الأخيرة، أصبح الشخص الرقمي المدعوم بالذكاء الاصطناعي أكثر واقعية في تفاصيل مثل الإلقاء الصوتي وتعبيرات الوجه والحركة، كما أصبح تدريجيًا يمتلك قدرات تفاعلية وتفكيرية أقوى.
"منذ عدة سنوات، كان من الممكن أن تعاني الشخصيات الرقمية من مشاكل مثل عدم تطابق الشفاه والتعابير، وعدم مرونة الحركات. يعود ذلك إلى أن الشخصيات الرقمية لم تكن تفهم المعاني النصية بشكل كاف، وكانت تعابيرها وحركاتها تعتمد في الغالب على موارد محدودة مسبقًا، مما يمنعها من التوافق بدقة مع محتوى النص." قالت قاو جينغ وين، مسؤولة أعمال الشخصيات الرقمية في شركة كيدا شينفاي، مع تقدم تقنية النماذج الكبيرة في مجال الشخصيات الرقمية، لقد حققت منتجات الشخصيات الرقمية أداءً جديدًا.
على سبيل المثال ، في أكتوبر من العام الماضي ، أصدرت iFLYTEK إنسانا رقميا مجسما فائقا. يعتمد على توليد الانتشار متعدد الأوضاع للنماذج الكبيرة ، والتي يمكن أن تولد حركات الجسم في الوقت الفعلي وفقا للإيقاع والتجويد ومحتوى الكلام ، واختراق قيود قوالب العمل المحددة مسبقا وتحسين تعبير البشر الرقميين بشكل كبير في المشاهد الديناميكية. يمكن للإنسان الرقمي Zhiying من Tencent تحقيق "استنساخ الصور" و "استنساخ الصوت" ، ويحتاج المستخدمون فقط إلى تحميل عدد صغير من الصور ومقاطع الفيديو والمواد الصوتية ، ويمكنهم إنشاء المستنسخة البشرية الرقمية الخاصة بهم بسرعة وتخصيص جرسهم. يمكن للإنسان الرقمي مفتوح المصدر الذكاء الاصطناعي من علي بابا ، EchoMic ، أن يعطي كلام وتعبيرا حيويا للصور الثابتة.
"ببساطة، فإن تقنية النماذج الكبيرة لا تتيح فقط للإنسان الرقمي فهم المعنى الحقيقي، بل تمكنه أيضًا من توليد حركات وتعبيرات مناسبة بسرعة بناءً على فهمه للنص، مما يجعله واقعيًا تمامًا." قالت غاو جينغ وين.
يعتقد شانغ بينغ، رئيس جمعية الإنترنت الصينية، أن الأفراد الرقميين أصبحوا نقطة دخول نشطة لتطبيقات الذكاء الاصطناعي، مع ارتباط قوي ودمج مع البيانات الضخمة، والأجهزة الذكية، والذكاء المتجسد، وقد يصبحون واحداً من واجهات التفاعل النشطة في الجيل التالي من الإنترنت. يجب التركيز على الممارسات التطبيقية للابتكار، واستكشاف بنشاط الأفراد الرقميين وغيرها من الأنماط الناشئة، وتسريع تشكيل مزايا التطبيقات ذات الحجم الكبير.
يعتقد وو سو نينغ أيضًا أن الشخصيات الرقمية هي نقطة انطلاق لتطبيقات الذكاء الاصطناعي ومدخل للابتكار في الذكاء الاصطناعي. الشخصيات الرقمية المدفوعة بالذكاء الاصطناعي من المتوقع أن تجلب تطبيقات أكثر تنوعًا وغنى لمختلف الصناعات، وهذه التطبيقات يمكن أن توجه الذكاء الاصطناعي نحو مسار التنمية العملية.
إنشاء "توأم رقمي" مخصص
مع الاستخدام الواسع للإنسان الرقمي، تفرض العديد من السيناريوهات متطلبات أعلى على الإنسان الرقمي.
"على سبيل المثال ، تطرح سيناريوهات مثل البث المباشر للتجارة الإلكترونية وخدمة العملاء أسئلة وأجوبة متطلبات عالية للغاية لقدرة التفاعل في الوقت الفعلي للبشر الرقميين. يجب ألا يكون البشر الرقميون قادرين على إجراء محادثات في الوقت الفعلي مع المستخدمين فحسب ، بل يجب أن ينشئوا أيضا إجراءات وتعبيرات مقابلة وفقا لمحتوى الحوار ، وإلا فسيؤثر ذلك على كفاءة معالجة الأعمال ويؤثر بشكل مباشر على تجربة المستخدم. قدم Gao Jingwen أنه من أجل تحسين كفاءة نموذج توليد الفيديو البشري الرقمي ، طور فريق الشركة تقنية استخراج تمثيل العمل ، والتي تحول إدخال الكلام والنص إلى تمثيلات وسيطة مدمجة ، مما يؤدي إلى ضغط أبعاد الفيديو بشكل فعال. بمساعدة هذه التقنية ، يمكن للنظام استخراج المعلومات الأساسية بسرعة من نص الإدخال والصوت مثل كاتب الاختزال ، وتقليل كمية بيانات المعلومات غير ذات الصلة ، وإنشاء مقاطع فيديو وفقا لذلك ، مما يحسن بشكل كبير من كفاءة إنشاء الفيديو ويضمن التفاعل في الوقت الفعلي بين البشر الرقميين والمستخدمين.
يجب أن نلاحظ أنه رغم أن صناعة البشر الرقميين تتطور بسرعة، إلا أنها لا تزال في مرحلة النمو السريع. تعتقد غاو جينغ وين أن هناك ظاهرة تمايز بين منتجات البشر الرقميين في الوقت الحالي، وأن التخصيص والتفرد سيصبحان اتجاهين مهمين لتطوير صناعة البشر الرقميين في المستقبل. مع تطور تقنية الذكاء الاصطناعي التوليدي، انخفضت عتبة تكلفة إنتاج البشر الرقميين بشكل سريع، وزادت كفاءة الإنتاج وتنوع المحتوى بشكل ملحوظ، وأصبح بإمكان المستخدمين إنشاء منتجات بشر رقمية أكثر تخصيصًا بناءً على خصائصهم الشخصية. الآن، يمكن فقط من خلال صورة واحدة أو تسجيل صوتي لجملة واحدة إنتاج بشر رقمي فائق الشبه، مما يبسط بشكل كبير متطلبات المواد المسبقة للتخصيص ويُحسِّن مسار تشغيل المستخدم.
قالت غاو جينغ وين أيضًا إنه على الرغم من أن تقنية النماذج الكبيرة تدفع الشخصيات الرقمية "لدخول حياة الناس العاديين"، إلا أنه لتحقيق تأثيرات أكثر دقة، لا يزال من الضروري القيام بعملية تغذية بيانات وتدريب تفاعلي كبير. بالإضافة إلى ذلك، لا يمكن تجاهل المشكلات المرتبطة بانتهاك الخصوصية وأمان البيانات.
"ربما في المستقبل سيكون لدى كل واحد منا 'نسخة رقمية'، يمكن أن تساعدنا في التعامل مع العمل، والإجابة على تساؤلات الحياة، وتصبح رفيقنا." قالت قاو جينغ وين.
(المصدر: صحيفة التكنولوجيا)
المصدر: 东方财富网
المؤلف: صحيفة التكنولوجيا
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
الذكاء الاصطناعي يدفع الشخصيات الرقمية "للتحليق إلى منازل الناس العاديين"
منذ افتتاح جناح الصين في معرض إكسبو 2025 في أوساكا، اليابان، في أبريل، جذب العديد من الزوار "الحضور اليومي". عندما يدخل الزوار جناح الصين، يمكنهم سماع صوت يقول "俺老孙来也" من بعيد. هذا الصوت يأتي من شركة كودا إكسفاي (المشار إليها فيما يلي بـ "كودا إكسفاي") التي قامت بتطوير "AI سن ووكينغ" الذي يتقن ثلاث لغات: الصينية واليابانية والإنجليزية، والذي تم تصميمه ليشبه الشكل ونغمة الصوت لسن ووكينغ من الفيلم الكلاسيكي المتحرك "دا نانغ تيانغونغ".
خلف "AI سون وو كونغ"، توجد تقنية الأشخاص الرقميين التي تطورت بسرعة في السنوات الأخيرة. كحلقة وصل رئيسية بين الصناعات الناشئة مثل الذكاء الاصطناعي والميتافيرس، تزداد أهمية دور الأشخاص الرقميين في تطوير الاقتصاد الرقمي. مع التطبيق العميق لتقنية النماذج الكبيرة في هذا المجال، ينتقل الأشخاص الرقميون تدريجياً من "قابل للاستخدام" إلى "سهل الاستخدام"، مما يدفع الصناعات المعنية إلى دخول مرحلة جديدة من التطوير.
تشكيل ثلاث فئات من سيناريوهات التطبيق
الإنسان الرقمي هو كيان ذكي رقمي يتم إنشاؤه من خلال نمذجة وتكنولوجيا الذكاء الرقمي المتعددة. إنه يمتلك مظهرًا بشريًا وصوتًا ولغة، قادر على محاكاة الحركات الجسدية، ويتميز بقدرة على التفكير، ويمكنه من خلال دعم النماذج الكبيرة تحقيق التعلم، والتوليد، والتفاعل، وغيرها من الوظائف.
تحت قيادة التكنولوجيا والطلب، تتطور صناعة الأفراد الرقميين في بلادي بشكل متزايد، وتتوسع نطاق تطبيقاتها باستمرار، كما تتزايد قدرات الإنتاج والتشغيل والخدمات في سلسلة الصناعة上下游. تظهر بيانات Tianyancha أنه بحلول عام 2024، بلغ عدد الشركات المرتبطة بالأفراد الرقميين في بلادي 1.144 مليون شركة، وتم تسجيل أكثر من 174,000 شركة جديدة فقط في الأشهر الخمسة الأولى من عام 2024، مما يُظهر إمكانية السوق وحيوية صناعة الأفراد الرقميين.
يعتقد وُسو نينغ، عضو اللجنة الاستشارية لخبراء جمعية الإنترنت الصينية، أنه لتجنب أن تصبح تقنية الإنسان الرقمي مجرد شكل، مما يؤدي إلى هدر الموارد، يجب إيجاد منفذ للتطبيقات، ودفع تطبيقات الإنسان الرقمي من خلال نقاط معينة.
بدافع من التطبيقات، تسارع صناعة الإنسان الرقمي في بناء حلقة مغلقة من "التكنولوجيا - المشهد - الأعمال".
أصدرت جمعية الإنترنت الصينية "تقرير تطوير الأشخاص الرقميين في الصين (2024)" (المشار إليه فيما بعد باسم "التقرير")، الذي يحلل أن تطبيقات الأشخاص الرقميين قد تشكلت حاليًا بشكل أولي إلى ثلاثة فئات رئيسية: الأشخاص الرقميون في الوسائط، الأشخاص الرقميون في الخدمات، والأشخاص الرقميون في الصناعات. من بينها، يعد الأشخاص الرقميون في الوسائط الشكل الأكثر نضجًا لتطبيقات الأشخاص الرقميين في الوقت الحالي. يمكن أن تصل نسبة عدد المشاهدات الناتجة عن الأشخاص الرقميين في الوسائط إلى 50٪، حيث أن صورتهم الواقعية وتعبيراتهم اللغوية السلسة تعزز بشكل كبير من تفاعل المعلومات ونكهتها.
على سبيل المثال ، في "عرض ليلة رأس السنة الجديدة للعلوم والتكنولوجيا" الذي أطلقته الإذاعة والتلفزيون المركزي الصيني لأول مرة العام الماضي - "مهرجان الصين للابتكار في العلوم والتكنولوجيا" ، كان هناك مشهد حيث استضاف المضيف Zhang Tengyue و "استنساخ الذكاء الاصطناعي" على نفس المسرح. هذا "مضيف الذكاء الاصطناعي" المستند إلى منصة iFLYTEK الذكية iFLYTEK لا يمتلك نفس الصوت والتعبيرات والحركات مثل المضيف الحقيقي فحسب ، بل يمكنه أيضا التواصل مع المضيف بهدوء ، وفهم كلمات الطرف الآخر بدقة والاستجابة بسرعة وبشكل مناسب ، كما أن طلاقة التفاعل تجعل من الصعب على الجمهور التمييز بين الحقيقي والمزيف.
تظهر "التقرير" أنه بالإضافة إلى الأفراد الرقميين الوسائط، حقق الأفراد الرقميون في الخدمات أيضًا ترقية شاملة، حيث يمتلكون قدرة تفاعلية أقوى، وتصل نسبة عدد المشاهدات إلى 30٪، ويستخدمون على نطاق واسع في مجالات الحكومة والتجارة الإلكترونية والمالية؛ بينما بدأ الأفراد الرقميون في الصناعة في الظهور، حيث تصل نسبة عدد المشاهدات إلى 20٪، وبدءوا تدريجياً في لعب دور في الرعاية الصحية والتعليم وإدارة الأعمال.
من المتوقع أن تصبح مدخل الابتكار في الذكاء الاصطناعي
لقد مرت الشخصيات الرقمية بثلاث مراحل رئيسية: من القيادة البشرية إلى القيادة البرمجية، ثم إلى القيادة بواسطة الذكاء الاصطناعي في الوقت الحاضر.
في البداية، كان الشخص الرقمي المدعوم من البشر قادرًا على تقديم صورة رقمية افتراضية، لكنه كان يعتمد بشكل رئيسي على تقنيات نمذجة الرسوميات الحاسوبية والتقاط الحركة، حيث كان يتطلب دعمًا كبيرًا من البشر لتوفير كميات هائلة من البيانات اللغوية والحركية. بينما يمكن للشخص الرقمي المدعوم من البرامج ألا يعتمد على البشر لتوفير البيانات اللغوية والحركية، إلا أنه يعتمد على برنامج حاسوبي ثابت، مما يجعله أقرب إلى "روبوت رقمي"، ولا يمكنه تحقيق تأثيرات إنسانية عالية الدقة. في السنوات الأخيرة، أصبح الشخص الرقمي المدعوم بالذكاء الاصطناعي أكثر واقعية في تفاصيل مثل الإلقاء الصوتي وتعبيرات الوجه والحركة، كما أصبح تدريجيًا يمتلك قدرات تفاعلية وتفكيرية أقوى.
"منذ عدة سنوات، كان من الممكن أن تعاني الشخصيات الرقمية من مشاكل مثل عدم تطابق الشفاه والتعابير، وعدم مرونة الحركات. يعود ذلك إلى أن الشخصيات الرقمية لم تكن تفهم المعاني النصية بشكل كاف، وكانت تعابيرها وحركاتها تعتمد في الغالب على موارد محدودة مسبقًا، مما يمنعها من التوافق بدقة مع محتوى النص." قالت قاو جينغ وين، مسؤولة أعمال الشخصيات الرقمية في شركة كيدا شينفاي، مع تقدم تقنية النماذج الكبيرة في مجال الشخصيات الرقمية، لقد حققت منتجات الشخصيات الرقمية أداءً جديدًا.
على سبيل المثال ، في أكتوبر من العام الماضي ، أصدرت iFLYTEK إنسانا رقميا مجسما فائقا. يعتمد على توليد الانتشار متعدد الأوضاع للنماذج الكبيرة ، والتي يمكن أن تولد حركات الجسم في الوقت الفعلي وفقا للإيقاع والتجويد ومحتوى الكلام ، واختراق قيود قوالب العمل المحددة مسبقا وتحسين تعبير البشر الرقميين بشكل كبير في المشاهد الديناميكية. يمكن للإنسان الرقمي Zhiying من Tencent تحقيق "استنساخ الصور" و "استنساخ الصوت" ، ويحتاج المستخدمون فقط إلى تحميل عدد صغير من الصور ومقاطع الفيديو والمواد الصوتية ، ويمكنهم إنشاء المستنسخة البشرية الرقمية الخاصة بهم بسرعة وتخصيص جرسهم. يمكن للإنسان الرقمي مفتوح المصدر الذكاء الاصطناعي من علي بابا ، EchoMic ، أن يعطي كلام وتعبيرا حيويا للصور الثابتة.
"ببساطة، فإن تقنية النماذج الكبيرة لا تتيح فقط للإنسان الرقمي فهم المعنى الحقيقي، بل تمكنه أيضًا من توليد حركات وتعبيرات مناسبة بسرعة بناءً على فهمه للنص، مما يجعله واقعيًا تمامًا." قالت غاو جينغ وين.
يعتقد شانغ بينغ، رئيس جمعية الإنترنت الصينية، أن الأفراد الرقميين أصبحوا نقطة دخول نشطة لتطبيقات الذكاء الاصطناعي، مع ارتباط قوي ودمج مع البيانات الضخمة، والأجهزة الذكية، والذكاء المتجسد، وقد يصبحون واحداً من واجهات التفاعل النشطة في الجيل التالي من الإنترنت. يجب التركيز على الممارسات التطبيقية للابتكار، واستكشاف بنشاط الأفراد الرقميين وغيرها من الأنماط الناشئة، وتسريع تشكيل مزايا التطبيقات ذات الحجم الكبير.
يعتقد وو سو نينغ أيضًا أن الشخصيات الرقمية هي نقطة انطلاق لتطبيقات الذكاء الاصطناعي ومدخل للابتكار في الذكاء الاصطناعي. الشخصيات الرقمية المدفوعة بالذكاء الاصطناعي من المتوقع أن تجلب تطبيقات أكثر تنوعًا وغنى لمختلف الصناعات، وهذه التطبيقات يمكن أن توجه الذكاء الاصطناعي نحو مسار التنمية العملية.
إنشاء "توأم رقمي" مخصص
مع الاستخدام الواسع للإنسان الرقمي، تفرض العديد من السيناريوهات متطلبات أعلى على الإنسان الرقمي.
"على سبيل المثال ، تطرح سيناريوهات مثل البث المباشر للتجارة الإلكترونية وخدمة العملاء أسئلة وأجوبة متطلبات عالية للغاية لقدرة التفاعل في الوقت الفعلي للبشر الرقميين. يجب ألا يكون البشر الرقميون قادرين على إجراء محادثات في الوقت الفعلي مع المستخدمين فحسب ، بل يجب أن ينشئوا أيضا إجراءات وتعبيرات مقابلة وفقا لمحتوى الحوار ، وإلا فسيؤثر ذلك على كفاءة معالجة الأعمال ويؤثر بشكل مباشر على تجربة المستخدم. قدم Gao Jingwen أنه من أجل تحسين كفاءة نموذج توليد الفيديو البشري الرقمي ، طور فريق الشركة تقنية استخراج تمثيل العمل ، والتي تحول إدخال الكلام والنص إلى تمثيلات وسيطة مدمجة ، مما يؤدي إلى ضغط أبعاد الفيديو بشكل فعال. بمساعدة هذه التقنية ، يمكن للنظام استخراج المعلومات الأساسية بسرعة من نص الإدخال والصوت مثل كاتب الاختزال ، وتقليل كمية بيانات المعلومات غير ذات الصلة ، وإنشاء مقاطع فيديو وفقا لذلك ، مما يحسن بشكل كبير من كفاءة إنشاء الفيديو ويضمن التفاعل في الوقت الفعلي بين البشر الرقميين والمستخدمين.
يجب أن نلاحظ أنه رغم أن صناعة البشر الرقميين تتطور بسرعة، إلا أنها لا تزال في مرحلة النمو السريع. تعتقد غاو جينغ وين أن هناك ظاهرة تمايز بين منتجات البشر الرقميين في الوقت الحالي، وأن التخصيص والتفرد سيصبحان اتجاهين مهمين لتطوير صناعة البشر الرقميين في المستقبل. مع تطور تقنية الذكاء الاصطناعي التوليدي، انخفضت عتبة تكلفة إنتاج البشر الرقميين بشكل سريع، وزادت كفاءة الإنتاج وتنوع المحتوى بشكل ملحوظ، وأصبح بإمكان المستخدمين إنشاء منتجات بشر رقمية أكثر تخصيصًا بناءً على خصائصهم الشخصية. الآن، يمكن فقط من خلال صورة واحدة أو تسجيل صوتي لجملة واحدة إنتاج بشر رقمي فائق الشبه، مما يبسط بشكل كبير متطلبات المواد المسبقة للتخصيص ويُحسِّن مسار تشغيل المستخدم.
قالت غاو جينغ وين أيضًا إنه على الرغم من أن تقنية النماذج الكبيرة تدفع الشخصيات الرقمية "لدخول حياة الناس العاديين"، إلا أنه لتحقيق تأثيرات أكثر دقة، لا يزال من الضروري القيام بعملية تغذية بيانات وتدريب تفاعلي كبير. بالإضافة إلى ذلك، لا يمكن تجاهل المشكلات المرتبطة بانتهاك الخصوصية وأمان البيانات.
"ربما في المستقبل سيكون لدى كل واحد منا 'نسخة رقمية'، يمكن أن تساعدنا في التعامل مع العمل، والإجابة على تساؤلات الحياة، وتصبح رفيقنا." قالت قاو جينغ وين.
(المصدر: صحيفة التكنولوجيا)
المصدر: 东方财富网
المؤلف: صحيفة التكنولوجيا