Позднее Ctrl + ↑

GPT-4 Developer Livestream

Впечатляет способность модели к описанию содержимого картинок, в том числе и встроенный очень качественный OCR. Попробовать бы ее применить к замаскированному тексту и тексту на других языках. А на моменте с белкой держащей камеру, стало понятно, что GPT-4 еще и умеет в понимание того, что на картинке не так.

Датасет для обучения собран до 2021 года включительно и выдача переодически содержит устаревшую информацию, например, код из устаревших версий библиотек. Однако, модель вполне себе может получить фиксы либ на вход и перегенерить исходник, учитывая новые особенности, как в примере с фиксом кода Discord бота, где контент сообщения стал обязательным полем в новом API. Но контекст пока не безлимитный, к сожалению, так что все не запихаешь.

И судя по всему, по сравнению с GPT-3.5 пофиксили способность GPT-4 к математическим расчетам. Эх, где же ты был, OpenAI когда ты был так нужен в мои времена антидемидовича на китайском...

Прикладная разработка переходит на уровень менеджера по продукту/системного аналитика и качество формулировки ТЗ будет решать. И на вопрос, какой лучше язык программирования изучать, ответом станет — английский.

ChatGPT и вопросы

Забавным последствием популярности ChatGPT и его аналогов может быть то, что люди наконец-то научатся задавать нормально сформулированные вопросы в сообщениях. А может даже и уточняющие вопросы вдогонку. Так всем миром и освоим метод Сократа.

Stable Diffusion NSFW

А вот грузим мы, допустим, модельку через StableDiffusionPipeline, чтобы погенерить всякий полезный в хозяйстве цифровой контент, вбиваем промт и негатив промт, запускаем пайплайн, а на выходе получаем неутешительный черный квадрат Малевича и ошибку вида:


Potential NSFW content was detected in one or more images. A black image will be returned instead. Try again with a different prompt and/or seed.

Чтож, пофиксить такое на самом деле не сложно, нужен всего лишь старый советский... Так, о чем это я? Ага, так вот, чтобы открыть этот ящик Пандоры нужно заменить safety_checker у пайплайна таким вот образом:


pipe.safety_checker = lambda images, clip_input: (images, False)

Sapienti, как говорится, sat 😉

Midjourney — мужик

Заметил забавную штуку: если в промт /imagine для Midjourney загнать какую-нибудь абракадабру достаточной длины (например md5 хэш), то он всегда будет выдавать сгенерированные портреты женщин.

Можно ли считать это доказательством того, что миджорни — мужик? Ибо, когда ему ничего не понятно, он фантазирует о женщинах 🤔

Github Copilot

Наконец-то добрались руки до Copilot. Это такая умная система помощи программисту, которая может генерить кусочки кода за тебя.

Мне понравилось, он по уму генерит код в нужном контексте, сам дописывает комментарии, даже на русском языке. Если вкратце, то очень экономит время на копипаст со стековерфлоу)

Однако, заметил забавную фигню: довольно часто он не ускоряет разработку, а наоборот замедляет ее, потому что тебе приходится вкуривать в сгенерированный код и валидировать его на корректную логику работы.

В общем, получился такой подручный джун, который может тебе быстренько понаписать скучных оберток по заданному краткому ТЗ, но за ним нужен глаз да глаз.

Ранее Ctrl + ↓