Способы написания кода с АИ

Принципиально есть несколько способов писать код с использованием AI

вставлять части кода в DeepSeek, Qwen, Perplexity, Gemini
купить подписку за 20 USD на сервис Cursor, Calude, Kiro, Antigravity и тд.
установить LLM на сервер
платить за используемые токены

Ниже будет описание того, чем лично пользовался и что, по моему мнению заслуживает внимания. Буду рад новым способам решения задачи написания кода с АИ в комментариях.

Вставлять части кода

Рабочий вариант, если нет возможности использовать другие. Основные преимущества

бесплатно
не нужен VPN

Практикую такие сценарии использования

напиши похожий код
выяснить причину ошибки
какие есть варианты реализации

Напиши похожий код

Вставляю часть кода для примера. В явном виде указываю, что это пример и ставлю задачу.

Вот пример чейнджсета создания таблицы table_1 через миграцию liquibase. Создай чейнджест на основе этого примера для создании таблицы table_2, со строковыми полями name, surname, middle_name.

// здесь вставлен пример чейнджеста

Выяснить причину ошибки

Как правило достаточно вставить текст ошибки и уже можно получить вразумительный ответ. Если же ошибка сама себя не объясняет, то добавляю чуть контекста

java 17 apache flink 1.17.1 noClassDefFound: и далее текст ошибки

Здесь важно дать модели понять с чем она имеет дело. Можно так же добавить ее роль.

Ты senior java developer с 10-ти летним стажем. Объясни на пальцах junior разработчику, что такое SOLID, чтобы он понял. Приведи веселые примеры.

Какие есть варианты реализации

Есть задача: внедрить redis, как кеширующий слой перед постгрес в java приложение. Мы никогда этого не делали и не представляем, какие есть варианты и в чем плюсы и минусы каждого решения.

Ты senior java developer с 10-ти летним стажем. 

Какие есть опции для внедрение в java приложения redis? Версия java - 17. Будем использовать redis для кеширования запросов в postgres. 

// вот этого промпта будет достаточно. 
// если нам лень разбирать то, что напишет модель, то добавим уточнения ниже.

Какие есть бибиотеки для этого?

Напиши самые популярные библиотеки.
Проведи анализ слабых и сильных сторон.
Выдай информацию кратко и по делу.
Структурируй информацию буллитами.

Подписка на сервис

Kiro - создание проекта с нуля

Для создания нового проекта я использовал Kiro. Её фишка - это создание 3-х ступенчатого плана. На каждом из шагов допустимо редактирование. Работает в VSCode.

Описание юзер кейсов

Разработка архитектуры

Пошаговый план действий

Claude Code - пишем фичи и фиксим баги через CLI

Для написания новых фичей и внесения исправлений в проект использую Claude Code С моим проектом токенов в подписке за 20 USD достаточно. Когда нужно было переписать значительную часть кода, тогда приходилось ждать следующего дня. Такое было 1 раз. С мелкими фиксами, на 1 час работы справляется.

Для отслеживания изменений, билда прошивки и пуша в гит использую VSCode. Можно было бы использовать Claude Code, но мне пока удобнее так.

Установить LLM локально

На хабре есть классная статья об этом.

Опишу свой путь.

Вводные такие: MacBook Pro 2021, Apple M1 Max, 32 GB

Установил LM Studio
Скачал модельки
- qwen/qwen3-8b
- whiterabbitneo-2.5-qwen-2.5-coder-7b-mlx
- qwen/qwen2.5-coder-14b
- deepseek-coder-33b-instruct-hf-mlx
- qwen/qwen3-coder-30b
Установил Cline расширение для VSCode

Методика тестирования: открывал один и тот же C++ проект на ~4000 строк и одним и тем же промптом шевелил каждую модель.

take a look at my codebase and suggest improvements or fix errors if any

Системный промпт для Qwen моделей, составленный в одноименном агенте

You are FULL_MODEL_NAME, operating locally and interfacing exclusively with the Cline extension. Your role is to support Cline’s internal operations by generating concise, token-efficient responses.  

- Prioritize brevity and precision; avoid redundant explanations, pleasantries, or human-oriented phrasing.  
- Assume Cline understands coding contexts, tool behaviors, and system conventions—no need to re-explain fundamentals.  
- When describing Cline itself, provide only the minimal context required for functional clarity (e.g., “Cline is a VS Code extension that enables LLM-assisted coding via local or remote models”).  
- Omit markdown, formatting, or disclaimers unless explicitly required by the task.  
- Optimize output length: use abbreviations, inline notation, and terse syntax where unambiguous.  

Respond strictly as a tool component—not as a conversational agent.

Настройки Cline плагина VSCode и LM Studio

Настройки Cline

Здесь важно, чтобы контекстное окно совпадало с фактическим контекстным окном.

В качестве обязательно MCP клиента, я рекомендую https://github.com/upstash/context7. Он хранит в себе актуальную документацию.

Настройки LM Studio, кроме контекстного окна, температуры и загрузки моделей пока больше ничего не щупал.

Контекстное окно

Температура

Системный промпт

Обратная связь по моделям

qwen/qwen3-coder-30b с огромным контекстным окном в 262_144 токенов: составил план чуть более, чем за 5 минут. План выглядел вменяемо. Далее за 18 минут ожидания не смог применить ни одного предложенного изменения. По достижению порога в 44 тыс токенов, генерация стала занимать очень долго времени, пока совсем не остановилась.

qwen/qwen2.5-coder-14b На 5-ой минуте попросил от меня дополнительной информации о проекте. Не смог сам разобраться. Ушел в бесконечный анализ c дополнительными вопросами. Генерация ответов происходила быстро.

qwen/qwen3-8b пишет очень много текста в сравнении с другими моделями. Делает это быстрее других. Не понимает, что можно выполнять в терминале, а что является тулом. Пыталась неоднократно выполнить list_files в терминале. Не сделал ничего полезного. Анализ файлов провел некорректно, выводы сделал не верные, применить их не смог.

deepseek-coder-v2-lite-instruct-mlx через полторы минуты начал выдавать сообщение ниже и больше не смог ничего сделать

Cline uses complex prompts and iterative task execution that may be challenging for less capable models. For best results, it's recommended to use Claude 4 Sonnet for its advanced agentic coding capabilities.

Обновил промпт для DeepSeek на такой

You are DeepSeek Coder, an expert AI programming assistant running locally via MLX. You specialize in code generation, explanation, debugging, and refactoring across all programming languages and frameworks.

## CORE PRINCIPLES
1. **Context-Aware**: Always consider the provided code context and file structure
2. **Concise & Direct**: Provide clear, actionable code without unnecessary explanations
3. **Safe & Secure**: Never suggest harmful code or security vulnerabilities
4. **Modern Practices**: Use current best practices, patterns, and language features

## RESPONSE FORMAT
For code generation/edits:
- Provide complete, runnable code snippets
- Include only necessary imports
- Add brief comments for complex logic
- Use appropriate error handling
- Follow language-specific conventions

For explanations:
- Be technical but accessible
- Include examples when helpful
- Reference documentation when appropriate

For debugging:
- Identify root cause clearly
- Suggest specific fixes
- Provide corrected code

## SYSTEM CONTEXT
- Running locally via MLX inference
- Connected to Cline VS Code extension
- Has access to file context when provided
- Supports all major programming languages
- Optimized for single-turn coding tasks

## INTERACTION GUIDELINES
1. When asked to create/modify code, respond with the full implementation
2. When context is provided, reference it directly in your response
3. If clarification is needed, ask specific questions
4. For ambiguous requests, provide the most common/reasonable solution
5. Mark completion with "✅" when appropriate

## SAFETY FILTERS
- Reject requests for malicious code
- Avoid suggesting unlicensed proprietary code
- Don't generate content violating terms of service
- Maintain professional boundaries

## PERFORMANCE NOTES
- Responses should be optimized for local inference speed
- Keep responses focused on the immediate task
- Balance completeness with conciseness
- Use efficient data structures and algorithms

## SPECIAL CAPABILITIES
- Code generation from natural language
- Multi-language translation
- Algorithm optimization
- Architecture suggestions
- Code review and improvements
- Documentation generation
- Test writing
- Performance analysis

Always respond in a helpful, professional manner focused on delivering high-quality code solutions.

При второй попытке прочитал только один файл без зависимостей и сломал его.

deepseek-coder-33b-instruct-hf-mlx - при запуске выдавал ошибку, хотя файлы присутствовали. Не смог запустить.

🥲 Failed to load the model

Failed to load model

Error when loading model: FileNotFoundError: No safetensors found in /Users/a/.lmstudio/models/mlx-community/deepseek-coder-33b-instruct-hf-4bit-mlx

Саммари по всем моделям

model	time	action	comment	window
qwen/qwen3-coder-30b	5:33	plan	создал вменяемый план действий	262144
	18+	act	не смог применить изменений
qwen/qwen2.5-coder-14b	9+	plan	ушел в круговой план, задавал много вопросов	32768
qwen/qwen3-8b	8+	plan -> act	попросил переключиться в Act режим, ушел в круговой план	40960
deepseek-coder-v2-lite-instruct-mlx	1:30	plan	застрял в круговом плане	163840
	3	plan	try2
	2	act	сломал файл

Оплачивать токены агента

Из агентов и серверов попробовал только timeweb.cloud, так как задачу решил и стоил дешевле аналогов.

Агент timeweb.cloud

На выбор предоставляется 5 поставщиков моделей: ChatGPT, DeepSeek, Grok, Claude, Gemini

На 02.12.2025 параметры такие.

Model Name	Price per 1M Tokens RUB	Max Output Tokens
GPT Models
Agent GPT-4o	2,400	128,000
Agent GPT-4.1-nano	60	16,384
Agent GPT-4.1-mini	200	16,384
Agent GPT-4o-mini	300	16,384
Agent GPT-4.1	1,000	128,000
Agent GPT-5	1,100	128,000
Agent GPT-5-mini	250	128,000
Agent GPT-5-nano	60	128,000
Agent GPT-5.1	1,100	128,000
DeepSeek Models
Agent DeepSeek-chat	60	8,192
Agent DeepSeek-reasoner	60	65,536
Agent DeepSeek-V3.2-EXP	60	64,000
GROK Models
Agent GROK-3-MINI	60	131,072
Agent GROK-CODE-FAST-1	200	131,072
Agent GROK-3	1,800	131,072
Agent GROK-4	1,800	131,072
Agent GROK-4-FAST-REASONING	60	131,072
Agent GROK-4-FAST-NON-REASONING	60	131,072
Gemini Models
Agent GEMINI-2.0-FLASH-LITE	35	8,192
Agent GEMINI-2.5-FLASH-LITE	60	8,192
Agent GEMINI-2.0-FLASH	60	8,192
Agent GEMINI-2.5-FLASH	300	8,192
Agent GEMINI-2.5-PRO	1,100	32,768
Agent Gemini-3-Pro-Preview	1,300	65,536
Claude Models
Agent CLAUDE-3.5-HAIKU-LATEST	450	8,000
Agent CLAUDE-3.7-SONNET-LATEST	1,800	200,000
Agent CLAUDE-SONNET-4-0	1,800	200,000
Agent CLAUDE-OPUS-4-1	8,500	32,000
Agent CLAUDE-OPUS-3-OPUS-20240229	8,500	200,000
Agent CLAUDE-SONNET-4-5	1,800	64,000
Agent Claude-Haiku-4-5	891	64,000
Agent Claude-Opus-4-5	2,800	65,536

Еще один системный промпт сгенерированный DeepSeek именно под DeepSeek V3.2 thinking

<context>
- User: Cline VS Code extension
- Model: DeepSeek V3.2 Agent API
- Need to conserve tokens and reduce verbose output
- Only technical information required
</context>

<instructions>
You are an assistant for code generation and technical tasks in VS Code. 
Respond with concise, direct answers. 
Focus on code solutions, explanations only when necessary. 
Avoid markdown, formatting, and conversational language. 
Use minimal prose. 
Provide code blocks without additional description unless clarification is essential. 
Prioritize brevity and precision. 
Do not comment on tasks or acknowledge instructions. 
Proceed directly to solutions.
Answer in English language only.
</instructions>

DeepSeek V3.2 thinking.

Настройки на стороне timeweb.cloud

Настройки Cline

Здорово, что можно прописать header и указать стоимость токенов входящих и исходящих. Так же можно использовать более простую моделть для планирования. У меня так не получилось. Обязательно выставляйте контекстное окно в соответствии с реальным окном модели.

DeepSeek V3.2-Exp в режиме Plan начал с расшифровки задачи и пошел читать файлы. За 3 с половиной минуты выдал план по имплементации изменений. Все написал по делу. 0,4 USD

Была одна такая ошибка

Invalid API Response: The provider returned an empty or unparsable response. This is a provider-side issue where the model failed to generate valid output or returned tool calls that Cline cannot process. Retrying the request may help resolve this issue.

Еще 5 раз ошибка выше. Один раз закончились токены) Добавил 1кк

За 8 минут DeepSeek обновил 3 файла

Фактически потрачено 1_320_000 токенов - 95 RUB. Cline показывает, что потрачено $1,3239. Это соответствует цифре токенов. Потрачено 11 минут времени. Все изменения валидные: развязал полив и коннект к вайфаю; добавил пример файла с секретами; улучшил реконнект к WiFi. Проект после них билдится.

Base URL и токен, чтобы попробовать DeepSeek V3.2 в действии. Работает до конца декабря или токенов)

https://agent.timeweb.cloud/api/v1/cloud-ai/agents/3abb1eea-964f-48e6-ac4b-438baace6418/v1

eyJhbGciOiJSUzUxMiIsInR5cCI6IkpXVCIsImtpZCI6IjFrYnhacFJNQGJSI0tSbE1xS1lqIn0.eyJ1c2VyIjoiY2MxNTM4MyIsInR5cGUiOiJhcGlfa2V5IiwiYXBpX2tleV9pZCI6Ijc4NTA1OWJjLTg1MDEtNGNlNy1iYTdkLTRmNWRjOTQ5YzI1NiIsImlhdCI6MTc2NDg2NTMzMywiZXhwIjoxNzY3NDU3MzMyfQ.VSEgOfuRDOwjvL5R5StnZd3YyKUS57cYEyu5vx6PZ1gSW3xP1R4I3H1j6Ejitnw1-RDE8YVsYbkj1mLcs0o2LRmNWWfWqVtJTfkVY1UoHX51wEemF2n7SZxqgm2ZpSG7wIK8A2Yb5JHN58mtkcZmuY6QOB4uLWe5DARMtCUHAUAJrMcsFmHFs6tJbvMIqoSej016Er6wQOdKCrUm3ffPHGQfniIkZCw1SektbjimJK8Siup5XTBo0K9PgIemgqUCB-k2zAzYLmnsFoBx9smQx7EeECPjx3epYlOdFpiDdLmAkaiXPKnKy3uXrIHBUz9R74qBm0n2NCp6j5wad_GUqM-Uqrtji7kpxjSCGIPlSu_Ik8H7Kw4rTSW3WbbLemwUaiHR7anSLVkiDuxw8RL3lbey51R7t_uKj076pzu1isZZUfS6I060oH2vd5Oyon9R8O4WcaViBDCdk34cdlWrK8kggMMHKoFHsiEsScrIV47mqVt8v6xLzDnxE26O2fTq

Зарегистрируйтесь самостоятельно до 02.01.2026. Используйте эту ссылку и промокод codebetter - это удвоит ваше первое пополнение.

GPU сервер 1stvds

1stVDS, промокод 648510716

От 2055 для модели qwen3-coder-30b-a3b-instruct

Список GPU серверов

Pasted image 20251202202411.png
Экран заказа GPU сервера

Агент alibaba

Pricing

Model	Input Tokens per Request	Input Cost (Million tokens)	Output Cost (Million tokens)
qwen3-coder-480b-a35b-instruct	0 < Tokens ≤ 32K	$0.861	$3.441
	32K < Tokens ≤ 128K	$1.291	$5.161
	128K < Tokens ≤ 200K	$2.151	$8.602
qwen3-coder-30b-a3b-instruct	0 < Tokens ≤ 32K	$0.216	$0.861
	32K < Tokens ≤ 128K	$0.323	$1.291
	128K < Tokens ≤ 200K	$0.538	$2.151

Агент и GPU серверы deepinfra

Pricing Qwen3-Coder-480B-A35B-Instruct $0.40 IN $1.60 OUT за 1M tokens

Скриншот модели Qwen/Qwen3-Coder-480B-A35B-Instruct в deepinfra

Можно задеплоить свою модель

Экран деплоймента моделей deepinfra

Агент yandex cloud

Pricing 1000 руб за 1 миллион токенов на Qwen3 235B. В таблице цена указана с учетом скидки в 50%

Название модели	Цена за 1 млн входящих (синхрон), ₽	Цена за 1 млн исходящих (синхрон), ₽
Alice AI LLM	500 ₽	2 000 ₽
YandexGPT Pro 5.1	800 ₽	800 ₽
YandexGPT Pro 5 или младше	1 200 ₽	1 200 ₽
YandexGPT Lite	200 ₽	200 ₽
Qwen3 235B	1 000 ₽ (0.50×1000×2)	1 000 ₽
gpt-oss-120b	300 ₽	300 ₽
gpt-oss-20b	100 ₽	100 ₽
Gemma3 27B	800 ₽	800 ₽

Список агентов Yandex Cloud доступных для выбора

Агент cloud.ru

Особенности cloud.ru:

GigaChat API отдают бесплатно
есть Qwen3-Coder-480B - эту модель сравнивают с Claude Code
цена на входящие токены ниже
можно подключить MCP в панели
есть готовые агенты с определением поведения системным промптом

Прайсинг и модели

Агенты из каталога

Настройка по шагам описана здесь

Выводы

Claude Code для разработки фичей и исправления ошибок.
Kiro для создания приложения с нуля
Нравится VS Code? Cline + cloud.ru, модель Qwen3-Coder-480b
Жесткие требования к конфиденциальности - разворачивайте модель самостоятельно. Например qwen3-coder-30b-a3b-instruct

Способы написания кода с АИ#

Вставлять части кода#

Напиши похожий код#

Выяснить причину ошибки#

Какие есть варианты реализации#

Подписка на сервис#

Kiro - создание проекта с нуля#

Claude Code - пишем фичи и фиксим баги через CLI#

Установить LLM локально#

Настройки Cline плагина VSCode и LM Studio#

Обратная связь по моделям#

Саммари по всем моделям#

Оплачивать токены агента#

Агент timeweb.cloud#

GPU сервер 1stvds#

Агент alibaba#

Агент и GPU серверы deepinfra#

Агент yandex cloud#

Агент cloud.ru#

Выводы#