Новые блоки

Блок научной эффективности

Согласно научным исследованиям

21% → 98%

точность на сложных логических задачах
при работе по технологии «Швейцарский нож»

*98% – консервативная оценка при объединении приёмов. Подробности, ограничения и ссылки – в PDF.

Итоговая цифра – аппроксимация по данным трёх линий исследований. Ниже – из чего она складывается.

Самопромптинг (переформулировка) – основной вклад: 21% → >95% в тестах на Big-Bench Hard.
Критика и правка – добираем точность поверх базового ответа: в исследованиях −30% фактических ошибок и +4–6 п.п. accuracy на сложных бенчмарках.
Уточняющие вопросы – меньше ошибок из-за недосказанности: в экспериментах ≈+5 п.п. F1 на неоднозначных запросах.