Изкуственият интелект породи много спорове сред специалистите за това доколко достоверни са неговите отговори. OpenAI, разработчикът на ChatGPT, въведе нов бенчмарк SimpleQA, за да оцени точността на изхода на AI моделите. Резултатите от теста разкриха сериозни проблеми с надеждността на информацията, генерирана от големите езикови модели (LLM) – средно в 60% от случаите отговорите са грешни….