Блок научной эффективности
Согласно научным исследованиям
21% → 98%
*
точность на сложных логических задачах
при работе по технологии «Швейцарский нож»
*98% – консервативная оценка при объединении приёмов. Подробности, ограничения и ссылки – в PDF.
Научный подход в работе с ИИ
Итоговая цифра – аппроксимация по данным трёх линий исследований. Ниже – из чего она складывается.
Самопромптинг (переформулировка)
– основной вклад:
21% → >95%
в тестах на Big-Bench Hard.
Критика и правка
– добираем точность поверх базового ответа: в исследованиях
−30%
фактических ошибок и
+4–6 п.п.
accuracy на сложных бенчмарках.
Уточняющие вопросы
– меньше ошибок из-за недосказанности: в экспериментах
≈+5 п.п.
F1 на неоднозначных запросах.
Читать исследование (PDF)
Исследование (PDF)
–
100%
+
Закрыть
Made on
Tilda