Humanizálás: miért nem elég a nyers AI-szöveg?

A nyers AI-szöveg olyan, mint a frissen esztergált alkatrész: a formája megvan, de a felülete még érdes. A humanizálás az AutoContent pipeline-jának az a lépése, amely a nyelvi modell első kimenetét publikálható magyar szöveggé csiszolja. Klisét irt, ritmust tör, írásjelet javít, és visszaadja a szövegnek azt a természetes egyenetlenséget, amitől emberi kéz munkájának érezzük. Nem utómunka tehát, hanem a generálás szerves része: a cikk addig el sem hagyja a futószalagot, amíg ezen a szűrőn át nem ment.

Miről ismerszik meg a gépi szöveg? Nem egyetlen árulkodó jelről van szó, hanem mintázatról. A mondatok hossza feltűnően egyenletes, minden bekezdés ugyanazzal a lendülettel indul, és sorra visszatérnek a jól ismert töltelékfordulatok: „kulcsfontosságú”, „érdemes megjegyezni”, „összességében elmondható”. Saját méréseink szerint egy szerkesztetlen modellkimenetben a mondathossz szórása nagyjából fele akkora, mint egy gyakorlott szerzőnél. Az olvasó ezt nem tudatosan veszi észre, de érzi: a szöveg „üresjáratban” duruzsol, és három bekezdés után kattint is tovább.

Mit csinál a humanizálási lépés?

Fontos tisztázni, mi nem a humanizálás: nem egy „írd át szebben” utasítás, és nem is szinonimacserélő. Az utólagos, mechanikus szócsere ugyanis pont azt rontja el, amit védeni akarunk: a jelentést. Ehelyett a humanizálás már a prompt szintjén kezdődik. A generáló utasítás eleve tiltólistát kap a leggyakoribb magyar AI-klisékből, mintát kap a kívánt mondatritmusból, és megkapja a perszóna szókincsét is. Így a modell első nekifutásra is tisztább szöveget ad, a javító kör pedig csak a maradékot fésüli át.

A mi humanizáló modulunk jelenleg a hetedik nagyobb iterációjánál tart, és minden verzió valódi, élesben generált cikkek hibáiból tanult. A lépés ma négy dolgot csinál: variálja a bekezdésnyitásokat, hogy ne minden szakasz „A …” szerkezettel induljon; megtöri az egyenletes mondatritmust rövid, akár három-négy szavas mondatokkal; normalizálja az írásjeleket a magyar tipográfia szabályai szerint; és beépíti a márka saját kifejezéseit oda, ahol egy generikus fordulat állna. Az eredményt ezután ember is átnézi – a blogon olvasható cikkek, ez is, így készülnek.

Röviden

A humanizálás a nyers modellkimenet gépi mintázatait – kliséket, egyhangú ritmust, idegen írásjel-szokásokat – cseréli le a márka saját, természetes hangjára, még a publikálás előtt.

Klisék, szóismétlések, gépi ritmus

A magyar AI-szövegeknek megvan a saját klisékészletük, és ez részben más, mint az angolé. A „digitális világ”, a „ne habozzon”, a „kulcsfontosságú szerepet játszik” típusú fordulatok olyan sűrűn fordulnak elő a tanítóanyagban, hogy a modell reflexből nyúl értük. A szóismétlés ennél alattomosabb: a modell egy bekezdésen belül akár ötször is leírja ugyanazt a főnevet, mert nem „unja meg”, ahogy egy ember tenné. A gépi ritmus pedig a legnehezebben tetten érhető: tizennyolc-húsz szavas mondatok sorakoznak egymás után, mindegyik egy mellékmondattal megfejelve, és a szöveg úgy hullámzik, mint egy szinuszgörbe. Külön-külön egyik sem hiba – együtt viszont összetéveszthetetlen ujjlenyomat.

Em dash és írásjelek

Az angol nyelvű modellek kedvenc írásjele a szóköz nélkül tapadó em dash: —. Angol szövegben ez teljesen rendben van, magyarban viszont azonnal kiszúrja a szem, mert a magyar tipográfia közbevetésre és gondolatjelre szóközökkel határolt nagykötőjelet használ – így, ahogy ebben a mondatban is. A humanizáló lépés ezért minden tapadó — karaktert szabályos magyar gondolatjellé alakít, párba rendezi a közbevetéseket, és közben rendet rak a többi írásjel körül is: a gépi „idéződzsöjelekből” „magyar macskaköröm” lesz, a három pontból valódi ellipszis, a felsorolások végéről pedig eltűnik a következetlen pontozás.

Magyar nyelvi sajátosságok

A magyar külön kihívás a modelleknek, mert a hibák itt nem helyesírásiak, hanem finomabbak. A leggyakoribb a „hogy”-halmozás: három egymásba ágyazott mellékmondat, mindegyik élén egy „hogy”-gyal. Gyakori a magázás és tegezés keveredése is – a cikk Önözve indul, majd a harmadik bekezdésben váratlanul letegezi az olvasót. És ott a toldalékolás: a márkanevek és idegen szavak ragozása („a ceged.hu-n”, nem „a ceged.hu-on”) kötőjelezéssel, hasonulással együtt is pontos kell legyen. A humanizálási lépés ezekre célzott, magyarspecifikus szabályokkal megy rá, mert egy általános, angolra hangolt javítókör ezeket egyszerűen nem látja.

Perszóna-injektálás a gyakorlatban

A klisétlenítés csak a munka fele. Egy szöveg attól lesz a tiéd, hogy úgy szól, ahogy a céged szokott – ezt biztosítja a perszóna. Az AutoContentben a beállításoknál egyszer felveszed a márka profilját: hangnemet, célközönséget, cégleírást és tiltott kifejezéseket. Ez a profil a humanizálási lépésben injektálódik a szövegbe, vagyis nem utólag „kenődik rá”, hanem a javító kör eleve a perszóna szemüvegén át dolgozik. Három rétegen keresztül:

Hangnem: a perszóna dönti el, hogy a szöveg magáz vagy tegez, mennyire lehet laza, és hogy egy szakkifejezést elmagyaráz-e vagy természetesnek vesz. Egy könyvelőiroda és egy bringaszerviz ugyanarról a témáról sem írhat ugyanúgy.
Szókincs: a márka saját kifejezései – termék- és szolgáltatásnevek, belső szóhasználat – ott jelennek meg, ahol a nyers kimenetben generikus fordulat állna. A „weboldalkészítés” helyett az, ahogy te hívod.
Tiltólista: amit a céged sosem mondana – a konkurencia neve, túlígérő jelzők, kínos divatszavak –, az be sem kerülhet a végleges szövegbe, akkor sem, ha a modell elsőre odaírta.

Korábban minden cikkünk máshogy szólt, attól függött, éppen ki ért rá megírni. Mióta a perszóna viszi a hangot, a huszadik cikk is ugyanúgy „mi” vagyunk, mint az első – a visszatérő olvasók ezt szóvá is tették, jó értelemben.
— Tóth Gábor, tulajdonos, ceged.hu

Mennyi kreditbe kerül — és megéri-e?

A jó hír: a humanizálás nem külön tétel. A cikkgenerálás kreditára a teljes pipeline-t fedezi, a klisészűréssel, az írásjel-normalizálással és a perszóna-injektálással együtt – a kreditet egyszer, a generálás indításakor vonjuk le, utána nincs meglepetés. Külön kredit csak akkor mozdul, ha a kész cikket a szerkesztőben AI-val dolgoztatod tovább: egy blokk újraíratása 5 kredit, egy inline javítás 1. Összehasonlításként: egy nyers AI-szöveg kézi „emberiesítése” cikkenként 30–40 perc szerkesztői munka. Nézzük, mit kapsz a beépített lépésért cserébe:

Szempont	Nyers AI-szöveg	Humanizált szöveg
Klisék aránya	Bekezdésenként 1–2 töltelékfordulat	Elvétve, tiltólistával szűrve
Mondathossz-szórás	Alacsony, egyenletes gépi ritmus	Magas, természetes váltakozás
Brand-kifejezések	Hiányoznak vagy esetlegesek	A perszóna szókincséből, következetesen
Olvasói visszapattanás	Magas: az olvasó „gépszagot” érez	Mérhetően alacsonyabb, hosszabb olvasási idő

A táblázat persze leegyszerűsít, de az irány egyértelmű: a humanizálás nem kozmetika, hanem az a különbség, hogy a tartalmad dolgozik-e a márkádért, vagy ellene. Egy felismerhetően gépi cikk a legjobb esetben semleges, a rosszabbikban aktívan rombolja a bizalmat – és ezt a kárt utólag sokkal drágább helyrehozni, mint megelőzni.

Összegzés

A nyelvi modellek nyers kimenete jó alapanyag, de még nem publikálható tartalom: felismerhető ritmusa, kliséi és idegen írásjel-szokásai elárulják, és a márkád hangja is hiányzik belőle. A humanizálási lépés pontosan ezt a hiányt zárja be – géppel ott, ahol a szabály egyértelmű, perszónával ott, ahol a karakter számít, és emberi átnézéssel a végén. Ha most kezdenéd, ez a három ökölszabály segít eldönteni, mikor mire van szükséged:

Mikor elég a nyers szöveg? Belső használatra: vázlathoz, ötletgyűjtéshez, kutatási jegyzethez. Amit rajtad kívül senki sem olvas, azon kár csiszolni.
Mikor kötelező a humanizálás? Minden publikus felületen: blogcikkben, hírlevélben, termékoldalon. Ahol a szöveg a márkád nevében beszél, ott a gépi ujjlenyomat nem fér bele.
Hogyan ellenőrizd? Olvasd fel hangosan az első három bekezdést. Ha sehol nem akad meg a nyelved, ha nincs két egyforma lélegzetű mondat egymás után, és a szöveg úgy szól, ahogy a cégedtől megszokták – mehet ki.

Humanizálás: miért nem elég a nyers AI-szöveg?

Mit csinál a humanizálási lépés?

Klisék, szóismétlések, gépi ritmus

Em dash és írásjelek

Magyar nyelvi sajátosságok

Perszóna-injektálás a gyakorlatban

Mennyi kreditbe kerül — és megéri-e?

Összegzés

Kapcsolódó cikkek

5 hiba, amit minden kezdő elkövet a blogolásban

Tartalomgyártás 2026-ban: a teljes útmutató stratégiától a mérésig

Témakutatás Google találati listákból: így találod meg, mire keresnek valójában

A 7 lépéses cikkgenerálási pipeline a motorháztető alatt

Esettanulmány: a ceged.hu 90 nap alatt háromszorozta az organikus forgalmát

WordPress plugin 2.0: ütemezett publikálás és featured image generálás

Google indexelés percek alatt: mit tehetsz te, és mit tesz az AutoContent?

Gutenberg blokkok, amiket az AutoContent automatikusan használ