Humanizálás: miért nem elég a nyers AI-szöveg?

Összefoglaló

Klisé-tisztítás, perszóna-injektálás, em dash-csere — mi történik a pipeline humanizálási lépcsőjében, és miért éri meg a plusz kredit.

Tartalomjegyzék

A nyers AI-szöveg olyan, mint a frissen esztergált alkatrész: a formája megvan, de a felülete még érdes. A humanizálás az AutoContent pipeline-jának az a lépése, amely a nyelvi modell első kimenetét publikálható magyar szöveggé csiszolja. Klisét irt, ritmust tör, írásjelet javít, és visszaadja a szövegnek azt a természetes egyenetlenséget, amitől emberi kéz munkájának érezzük. Nem utómunka tehát, hanem a generálás szerves része: a cikk addig el sem hagyja a futószalagot, amíg ezen a szűrőn át nem ment.

Miről ismerszik meg a gépi szöveg? Nem egyetlen árulkodó jelről van szó, hanem mintázatról. A mondatok hossza feltűnően egyenletes, minden bekezdés ugyanazzal a lendülettel indul, és sorra visszatérnek a jól ismert töltelékfordulatok: „kulcsfontosságú”, „érdemes megjegyezni”, „összességében elmondható”. Saját méréseink szerint egy szerkesztetlen modellkimenetben a mondathossz szórása nagyjából fele akkora, mint egy gyakorlott szerzőnél. Az olvasó ezt nem tudatosan veszi észre, de érzi: a szöveg „üresjáratban” duruzsol, és három bekezdés után kattint is tovább.

Mit csinál a humanizálási lépés?

Fontos tisztázni, mi nem a humanizálás: nem egy „írd át szebben” utasítás, és nem is szinonimacserélő. Az utólagos, mechanikus szócsere ugyanis pont azt rontja el, amit védeni akarunk: a jelentést. Ehelyett a humanizálás már a prompt szintjén kezdődik. A generáló utasítás eleve tiltólistát kap a leggyakoribb magyar AI-klisékből, mintát kap a kívánt mondatritmusból, és megkapja a perszóna szókincsét is. Így a modell első nekifutásra is tisztább szöveget ad, a javító kör pedig csak a maradékot fésüli át.

A mi humanizáló modulunk jelenleg a hetedik nagyobb iterációjánál tart, és minden verzió valódi, élesben generált cikkek hibáiból tanult. A lépés ma négy dolgot csinál: variálja a bekezdésnyitásokat, hogy ne minden szakasz „A …” szerkezettel induljon; megtöri az egyenletes mondatritmust rövid, akár három-négy szavas mondatokkal; normalizálja az írásjeleket a magyar tipográfia szabályai szerint; és beépíti a márka saját kifejezéseit oda, ahol egy generikus fordulat állna. Az eredményt ezután ember is átnézi – a blogon olvasható cikkek, ez is, így készülnek.

Röviden

A humanizálás a nyers modellkimenet gépi mintázatait – kliséket, egyhangú ritmust, idegen írásjel-szokásokat – cseréli le a márka saját, természetes hangjára, még a publikálás előtt.

Klisék, szóismétlések, gépi ritmus

A magyar AI-szövegeknek megvan a saját klisékészletük, és ez részben más, mint az angolé. A „digitális világ”, a „ne habozzon”, a „kulcsfontosságú szerepet játszik” típusú fordulatok olyan sűrűn fordulnak elő a tanítóanyagban, hogy a modell reflexből nyúl értük. A szóismétlés ennél alattomosabb: a modell egy bekezdésen belül akár ötször is leírja ugyanazt a főnevet, mert nem „unja meg”, ahogy egy ember tenné. A gépi ritmus pedig a legnehezebben tetten érhető: tizennyolc-húsz szavas mondatok sorakoznak egymás után, mindegyik egy mellékmondattal megfejelve, és a szöveg úgy hullámzik, mint egy szinuszgörbe. Külön-külön egyik sem hiba – együtt viszont összetéveszthetetlen ujjlenyomat.

Em dash és írásjelek

Az angol nyelvű modellek kedvenc írásjele a szóköz nélkül tapadó em dash: . Angol szövegben ez teljesen rendben van, magyarban viszont azonnal kiszúrja a szem, mert a magyar tipográfia közbevetésre és gondolatjelre szóközökkel határolt nagykötőjelet használ – így, ahogy ebben a mondatban is. A humanizáló lépés ezért minden tapadó karaktert szabályos magyar gondolatjellé alakít, párba rendezi a közbevetéseket, és közben rendet rak a többi írásjel körül is: a gépi „idéződzsöjelekből” „magyar macskaköröm” lesz, a három pontból valódi ellipszis, a felsorolások végéről pedig eltűnik a következetlen pontozás.

Magyar nyelvi sajátosságok

A magyar külön kihívás a modelleknek, mert a hibák itt nem helyesírásiak, hanem finomabbak. A leggyakoribb a „hogy”-halmozás: három egymásba ágyazott mellékmondat, mindegyik élén egy „hogy”-gyal. Gyakori a magázás és tegezés keveredése is – a cikk Önözve indul, majd a harmadik bekezdésben váratlanul letegezi az olvasót. És ott a toldalékolás: a márkanevek és idegen szavak ragozása („a ceged.hu-n”, nem „a ceged.hu-on”) kötőjelezéssel, hasonulással együtt is pontos kell legyen. A humanizálási lépés ezekre célzott, magyarspecifikus szabályokkal megy rá, mert egy általános, angolra hangolt javítókör ezeket egyszerűen nem látja.

Perszóna-injektálás a gyakorlatban

A klisétlenítés csak a munka fele. Egy szöveg attól lesz a tiéd, hogy úgy szól, ahogy a céged szokott – ezt biztosítja a perszóna. Az AutoContentben a beállításoknál egyszer felveszed a márka profilját: hangnemet, célközönséget, cégleírást és tiltott kifejezéseket. Ez a profil a humanizálási lépésben injektálódik a szövegbe, vagyis nem utólag „kenődik rá”, hanem a javító kör eleve a perszóna szemüvegén át dolgozik. Három rétegen keresztül:

  • Hangnem: a perszóna dönti el, hogy a szöveg magáz vagy tegez, mennyire lehet laza, és hogy egy szakkifejezést elmagyaráz-e vagy természetesnek vesz. Egy könyvelőiroda és egy bringaszerviz ugyanarról a témáról sem írhat ugyanúgy.
  • Szókincs: a márka saját kifejezései – termék- és szolgáltatásnevek, belső szóhasználat – ott jelennek meg, ahol a nyers kimenetben generikus fordulat állna. A „weboldalkészítés” helyett az, ahogy te hívod.
  • Tiltólista: amit a céged sosem mondana – a konkurencia neve, túlígérő jelzők, kínos divatszavak –, az be sem kerülhet a végleges szövegbe, akkor sem, ha a modell elsőre odaírta.

Korábban minden cikkünk máshogy szólt, attól függött, éppen ki ért rá megírni. Mióta a perszóna viszi a hangot, a huszadik cikk is ugyanúgy „mi” vagyunk, mint az első – a visszatérő olvasók ezt szóvá is tették, jó értelemben.

— Tóth Gábor, tulajdonos, ceged.hu

Mennyi kreditbe kerül — és megéri-e?

A jó hír: a humanizálás nem külön tétel. A cikkgenerálás kreditára a teljes pipeline-t fedezi, a klisészűréssel, az írásjel-normalizálással és a perszóna-injektálással együtt – a kreditet egyszer, a generálás indításakor vonjuk le, utána nincs meglepetés. Külön kredit csak akkor mozdul, ha a kész cikket a szerkesztőben AI-val dolgoztatod tovább: egy blokk újraíratása 5 kredit, egy inline javítás 1. Összehasonlításként: egy nyers AI-szöveg kézi „emberiesítése” cikkenként 30–40 perc szerkesztői munka. Nézzük, mit kapsz a beépített lépésért cserébe:

SzempontNyers AI-szövegHumanizált szöveg
Klisék arányaBekezdésenként 1–2 töltelékfordulatElvétve, tiltólistával szűrve
Mondathossz-szórásAlacsony, egyenletes gépi ritmusMagas, természetes váltakozás
Brand-kifejezésekHiányoznak vagy esetlegesekA perszóna szókincséből, következetesen
Olvasói visszapattanásMagas: az olvasó „gépszagot” érezMérhetően alacsonyabb, hosszabb olvasási idő

A táblázat persze leegyszerűsít, de az irány egyértelmű: a humanizálás nem kozmetika, hanem az a különbség, hogy a tartalmad dolgozik-e a márkádért, vagy ellene. Egy felismerhetően gépi cikk a legjobb esetben semleges, a rosszabbikban aktívan rombolja a bizalmat – és ezt a kárt utólag sokkal drágább helyrehozni, mint megelőzni.


Összegzés

A nyelvi modellek nyers kimenete jó alapanyag, de még nem publikálható tartalom: felismerhető ritmusa, kliséi és idegen írásjel-szokásai elárulják, és a márkád hangja is hiányzik belőle. A humanizálási lépés pontosan ezt a hiányt zárja be – géppel ott, ahol a szabály egyértelmű, perszónával ott, ahol a karakter számít, és emberi átnézéssel a végén. Ha most kezdenéd, ez a három ökölszabály segít eldönteni, mikor mire van szükséged:

  1. Mikor elég a nyers szöveg? Belső használatra: vázlathoz, ötletgyűjtéshez, kutatási jegyzethez. Amit rajtad kívül senki sem olvas, azon kár csiszolni.
  2. Mikor kötelező a humanizálás? Minden publikus felületen: blogcikkben, hírlevélben, termékoldalon. Ahol a szöveg a márkád nevében beszél, ott a gépi ujjlenyomat nem fér bele.
  3. Hogyan ellenőrizd? Olvasd fel hangosan az első három bekezdést. Ha sehol nem akad meg a nyelved, ha nincs két egyforma lélegzetű mondat egymás után, és a szöveg úgy szól, ahogy a cégedtől megszokták – mehet ki.
SN

A szerzőről

Szalai Nóra

Tartalommarketing- és SEO-szakértő, több mint tíz éve ír és szerkeszt magyar tech- és vállalati blogokat. Az AutoContent csapatában a generált cikkek minőség-ellenőrzéséért felel: ő hangolja a brand-hangot, és ő nézi át a cikkeket megjelenés előtt.