Audio Question Answering AI Models in 2026, Capabilities & Comparisons | AIPortalX

Filters

Selected Filters

Audio Question Answering

Task1

Organization

Country

Include Other Tiers

Active Research

Legacy Models

By default, only production models are shown

3 Models found

gpt-realtime

Domain

Task

Speech recognition ASR

Speech synthesis

Visual question answering+1 more

Gemini 2.5 Flash Native Audio

By Google DeepMind

Domain

Task

Speech-to-speech

Audio question answering

Text-to-speech TTS

Baichuan-Omni-1.5

Domain

Speech+2 more

Task

Language modeling

Language generation

Question answering+8 more

No more models