Блок научной эффективности
Согласно научным исследованиям
21% → 98%
точность на сложных логических задачах
при работе по технологии «Швейцарский нож»
*98% – консервативная оценка при объединении приёмов. Подробности, ограничения и ссылки – в PDF.

Научный подход в работе с ИИ

Итоговая цифра – аппроксимация по данным трёх линий исследований. Ниже – из чего она складывается.

  • Самопромптинг (переформулировка) – основной вклад: 21% → >95% в тестах на Big-Bench Hard.
  • Критика и правка – добираем точность поверх базового ответа: в исследованиях −30% фактических ошибок и +4–6 п.п. accuracy на сложных бенчмарках.
  • Уточняющие вопросы – меньше ошибок из-за недосказанности: в экспериментах ≈+5 п.п. F1 на неоднозначных запросах.
Made on
Tilda