Интересно. Но: "Как заявляют разработчики, самое явное преимущество Gemini заключается в её мультимодальности. Google не обучала отдельные модели для распознавания голоса и изображений, такие как DALL-E и Whisper от OpenAI, а с самого начала строила одну модель, способную воспринимать разные виды информации. И в Google обещают, что это восприятие будет только улучшаться."
Интересно. Но:
"Как заявляют разработчики, самое явное преимущество Gemini заключается в её мультимодальности. Google не обучала отдельные модели для распознавания голоса и изображений, такие как DALL-E и Whisper от OpenAI, а с самого начала строила одну модель, способную воспринимать разные виды информации. И в Google обещают, что это восприятие будет только улучшаться."
Я, кстати, об этом тут написал: https://vc.ru/services/871083-chatgpt-4-ne-prosto-chat-bot-kartinki-audio-video-besshovnyy-perehod-mezhdu-modelyami-menyaet-principy-raboty-s-ii