«

»

Roboţii de spam ar lua Bac-ul

26 Februarie 2012

Robot spam comentarii în limba română

Robot vorbăreţ

Roboţii de spam au învăţat limba română, folosesc metafora, ştiu cine sunt Zoso, Raed Arafat sau Dan Diaconescu şi plasează comentarii care pot fi amuzante. E drept, umorul e mai mult involuntar, iar sistemele automatizate au omis să treacă şi pe la botez, ca să-şi ia nume româneşti. Când generezi conţinut pe tema donaţiilor către SMURD, e dubios să te cheme Seydou Sanogo.

A trecut vremea scrisorilor nigeriene în care un care un nene numit Abdul Big Boss îţi explica, într-o engleză de baltă, despre averea unchiului tău negru de care mama a uitat să-ţi povestească, din motive înţelese doar de ea şi tuşa Tanţa. Tehnologia de spam şi scam a evoluat, semn că roboţeii flecari au şcoala lor de limbi străine, de la care nu chiulesc.

Puncte forte

De exemplu, la articolul Zoso lansează un blog nou, spambot-ul Kiran ne povesteşte despre admiraţia lui Marius Pahomi faţă de prezentarea susţinută de Vali Petcu la Webstock 2011. Iată captura de ecran a comentariului:

robot spam despre Zoso şi Pahomi

Observăm că Robo a înţeles tema articolului, generând un text aproape de subiect, destul de coerent pentru a putea fi atribuit unui utilizator uman. În plus, zice „la amândoi”, nu „amândurora”, deci e “suficient” de analfabet încât să fie uşor de confundat cu un român oarecare, din specia TPU.

Acelaşi soft ne-a mai scris despre Piaţa Universităţii, SMURD, OTV, Mircea Geoană, CV Tudor, Cancan, Click şi preşedintele Băsescu, pe care îl numeşte chiar „Zeus-ul PDL”. Baza de date e conectată la realităţile contemporane, fiind chiar optimizată pentru a jongla cu sensurile secundare ale expresiilor şi a simula umorul. Cum e imposibil să obţii aceste efecte printr-un proces integral automatizat, putem afirma că industria spam-ului se personalizează.

Limite şi slăbiciuni

Paradoxul e că deşi se descurcă excelent la capitolul metafore, sistemul gafează grav când vine vorba despre logica frazării. Mesajul pentru faianţarul Gică, spiritul luminat invitat la „una mică”, e cum nu se poate mai haios şi relevant:

Robot spam comentarii română

Gică, hai la o zugrăveală mică

Textul e semnat Bruna, adresa de e-mail simulează un server rusesc, iar robotul guraliv are IP nemţesc. Culmea globalizării, dar când te adresezi zidarului Gică din România, parcă un pic de localizare te-ar face mai verosimil.

Deşi compun comentarii în limba română, roboţeii care ne-au (dez)onorat cu prezenţa au cele mai neinspirate nume cu putinţă: Llaveros, Martinho, Yaprak etc. Nicio Nina, Didina, Marghioliţa, niciun Fănică, Stănică ori Sile.

Toate mesajele spam trimit doar către profiluri de Facebook, aşadar cel mai probabil ele au fost plasate cu Scrapebox (sau un program cu funcţii similare) pentru a găsi site-urile unde comentariile sunt aprobate automat, fără a filtrare umană sau automată.

Cu mici îmbunătăţiri, roboţii limbuţi vor depăşi abilităţile de exprimare ale unor europarlamentari, latifundiari sau chiar ziarişti români.

1
+2 Vote -1 Vote +1Ioana
26 Februarie 2012 @ 12:25

Am primit un newsletter cu subiectul: “Barcelona – Țigară – Cuțite – Veterinar – Tratament Corporal – Revizie – Istanbul – Corset – Pizza – Slăbire- Schimbare Cauciucuri”.

Mi-a placut totusi ca are tot ce vrei. Persoana care s-a ocupat de continut (cred ca este o persoana) s-a gandit la toate, iar asta e un lucru bun :)

2
+2 Vote -1 Vote +1Acru
26 Februarie 2012 @ 22:32

Oare cum vine firul epic, de la cap la coadă, adică: mergi la Barcelona, fumezi o ţigară, te taie băieţii etc.
sau invers: schimbi cauciucurile, te pui pe slăbit, apoi bagi o pizza ca să vezi daca mai încapi în corset?

3
+2 Vote -1 Vote +1coolnewz/Ratatouille
27 Februarie 2012 @ 12:36

cred ca din punct de vedere tehnologic este o chestie destuld e inteligenta. Pacat de utilizarea este in scopuri aiurite …

4
Vote -1 Vote +1Oliver
28 Februarie 2012 @ 12:41

Extragerea textului din HTML Link

Tu ce părere ai?