Prompt engineering в продакшне: 7 практик, которые реально работают
2026-04-02 · Дмитрий Соколов
Разбираем принципы, которые мы вынесли из двух лет обслуживания production-промптов для 200+ команд.
Инженерия, ML и обновления продукта.
2026-04-02 · Дмитрий Соколов
Разбираем принципы, которые мы вынесли из двух лет обслуживания production-промптов для 200+ команд.
2026-03-20 · Мария Петрова
Шесть практических приёмов, которые принесли нам самую большую экономию: от prompt caching до routing по задачам.
2026-03-05 · Мария Петрова
Сравнили Claude 3 Sonnet и GPT-4 на 3 реальных classification задачах. Вот результаты по accuracy, latency и cost.
2026-02-18 · Алексей Волков
Реальная архитектура роутера, который выбирает модель под задачу и экономит нам 30% бюджета без деградации качества.
2026-01-28 · Дмитрий Соколов
Комбинация prompt caching и умного retrieval позволила нам срезать latency и стоимость RAG-пайплайна, не трогая индекс.
2025-12-15 · Елена Козлова
Опыт двух лет использования LLM в роли judge: где работает, где проваливается, как калибровать.
2025-11-05 · Алексей Волков
За 6 недель перевели половину production workload с GPT-4 на Claude. Несколько сюрпризов, которые стоит знать заранее.
2025-10-10 · Мария Петрова
Прогнали один и тот же трафик через 7 LLM-провайдеров. Разбег по стоимости — до 4.5x при сопоставимом качестве.