шукаю допомоги заклиначів нейромереж
може хтось знає модель чи мережу яка може обробляти великі блоки україномовного тексту (більше 15 000 символів), та у результаті повертати список тем що у цьому тексті обговорювалась?
так собі хмара слів на стероїдах.
наприклад текст подкасту
на вході:
...бла...бла... нова машина хонди ...бла...бла... двигун потужний ...бла...бла... вартує дохера ...бла...бла... в стімі новий хіт ...бла...бла... покемони з пушками ...бла...бла... нінтендо плаче ...бла...бла...
на виході:
- новий автомобіль від концерну хонда
- гра про покемонів в стімі
я розумію шо це звучить як магія, але може хтось з подібними задачами грався?
я пробував годувати GPT-4 але на україномовний текст він погано відповідає, повторюється та галюценує, не знаходить ціли блоки. з коротким текстом ще більш менш, але коли тестові сегменти великі, то він не узагальнює.
може таке завдання і не підсилу, хз, того і питаю.
Подробнее
1СУ1ЮН на. 1 6лаГе>скле>ННе.СШЬ
пидоры помогите,реактор помоги,Моя Україна,разная политота
Еще на тему
результат ще гірший.
По друге - треба вказувати чіткі промпти. Спробуй у playground.
Та не відправляй більше 10 000 токенів.
В промтах спробуй вказати - поверни мені JSON, де кожен абзац буде окремо підсумован в окремому елементі массива, а потім вже додай мені тег саммарі та зроби саммарайз всього.
Дуже важливо казати чату щось робити покроково. Тому що так працюють ці моделі.