Попробуй llava3.2, MiniCPM-v (могут в VQA). Это все есть на HF и ollama. С ollama легче запустить. Если нужно шустрое, то moondream2, но сама по себе моделька не сильная. Можно поискать на HF конкретно под предметную область, может кто-то дообучал. А так по классике, если опенсорс не сработает, то придется тюнить на чем-то.