ասք պակասող արհամարհանքի մասին

այս տեքստը վաղուց էի ուզում գրել, բայց ինչեւէ։

ուրեմն, վերջերս վաթինեանի ցուցահանդէսն է բացուել, ուր շրջանակների մէջ, տրանսլիտով գրուած է, ասենք՝ «STEX MENQ @NKERNEROV TJJUM ENK» կամ ասենք «ES EN NKARNERIC A VOR PITI ZGAS» եւ ինձ ամենաշատ դուր եկած գործն ասում էր՝

DSCF2156

յիշեցի երկու պատմութիւն․

Ա․
խոհանոցում ես իմ համար թէյ էի լցնում, ինչ֊որ աղջիկներ էին նստած, ուրախ էին, ու երեւի այդ ուրախութիւնից ինձ դիմեցին, ինչ֊որ այդ «լաւագյոն ուսանող» ծրագրից էին խօսում։

ես էլ արտայայտուեցի, որ կարծում եմ, որ մեր մօտի hall of fame֊ը hall of shame է, որ ես տը մտածում էի սա կամ նա նորմալ մարդիկ են, կարծես նորմալ են հագնւում, կարծես տգէտ չեն, բայց գնում են, ՍՍ֊ի ձեռքից մրցանակ են ստանում։

զարմացան՝ ասացին, բայց ի՞նչ կայ։

ասում եմ՝ ակնյա՞յտ չի, որ դա լեգիտիմ դառնալու, երեւալու ձեւ է, որ տեսէք, այս խելացի մարդը, որը անկասկած խելացի է, լաւ է սովորել, լաւ տեսք ունի, «սիրուն բոյով» աղջիկ է ասենք թէ, իմ ձեռքերից մրցանակ է վերցնում, ձեռքս սեղմում է, միասին նկարւում ենք։

ուրեմն ոչինչ, որ արիւնոտ էր իշխանութեանս գալը, ուրեմն ոչինչ, որ կեղծիքներ են եղել, ոչինչ այն ամէնը, որը օրինակարգ լինելու հիմքը չի ամրապնդում՝ տեսէք, սա ամրապնդում է։

— պէտք է,— ասում եմ,— ոչ մէկ, ով արժանի է, չուզէր այդ մրցանակը ստանալ, ոչ մէկ չուզէր գնալ այդ լուսանկարում երեւալ, պէտք է այդ մրցոյթը իգնորուած լինէր։ ու ապա այս օրինակարգացնելու միջոցը չէր էլ կիրառուի։

— բայց, — ասաց ինձ ինչ֊որ մի աղջիկ վիրաւորուած,— այս 600.000֊ը ուսանողի համար փոքր փող չէ, չարժէ մեղադրել ուսանողներին։

— դէ, — ասում եմ, — փողի չափն ի՞նչ կապ ունի։ եթէ վաճառւում ես, ապա վաճառւում ես։

ինչ֊որ վեր կացան, գնացին։ սեղանին թուղթ մնաց, թղթի վրայ ֆոտոներ էին։
այդ աղջիկը մրցանակ ստացողներից էր՝ նոր էր ստացել։

հիմա, սակայն, որ տեսնում է միշտ ասում է՝ «բարեւ ձեզ»։ ինչի «մե՞զ», ես կարծես մի հատ եմ, բայց ինչեւէ։

Բ․

«Հակահարուած»֊ի Արտակին վերջերս սահմանել են։
Արտակը ինչ֊որ ստուարաթղթից տանկ է սարքել, մտել է դրա մէջ, ու քայլել է Երեւանով մէկ։ Այցելել է զանազան կառավարական շէնքեր, ներառեալ «բաղրամեան 26»֊ը, այնտեղ իրեն ասել են ոստիկանները՝ «զգոյշ եղիր, լոյսեր չունես, կարող է խփեն քեզ»՝ նա մայթով չէր ման գալիս, այլ աւտոմեքենաների գծով։

այսպէս, քաղաքով պտտուել է, գնացել է նալբանդեանի աած֊ի շէնքի մօտ, եթէ չեմ սխալւում, թողել է տանկն այնտեղ։ ասում են թէ՝ խփել է ինչ֊որ դարպասի ստուարաթղթով, նոր թողել֊գնացել է։

հիմա Արտակին դատում են՝ անցեալ շաբաթ դատ էր։

քանի որ աած֊ի աշխատողները հոգեւոր տառապանքներ տարան այդ դէպքից։

ահա թէ ինչպէս Արտակին սահմանել է իշխանութիւնը։

Եթէ իր արածը արհամարհուած մնար, կը ստացուէր, որ Արտակը յիմարի մէկն է։ Երեխայական բան է արել։

Բայց Արտակի արուածին արձագանք եղաւ։

Ապա նա յիմարի մէկը չէ, նա արդէն կարեւոր մարդ է՝ քաղաքական մոտիւներով հետապնդուող արուեստագէտ է, դիսիդենտ է, այլախոհ է։

մորալ․

Այս երկու պատմութիւնը չարհամարհուելու մասին էին։

Մեզ պակասում է արհամարհելը։

Չէի հրաժարուի այնպիսի իրականութիւնից, ուր եւ այդ մրցոյթը, եւ Արտակի զբօսանքը արհամարհուած լինէին։

Արհամարհենք զմիմեանս։ Ամէն։

այսօր ինչ֊որ հետազօտութական բլոգ գրառումների էի կարդում հաքեր նիւս֊ում (ոչ թէ համալսարանական հետազօտական, այլ ասենք մարդիկ ոնց են ինչ֊որ բաներ փորձում եղած տեխնոլոգիաների հետ) ու զգացի որ ես փորձեր անում եմ, բայց չեմ գրում դրանց մասին այլեւս։

նաեւ հասկացայ ինչու։
ես դարձել եմ աւելի փակ անձ։ ակնյայտօրէն։

ու ես շատ լաւ գիտեմ պատճառներից մէկը։ պատճառներից մէկը՝ լեզուն է, որով ես գրում եմ։ քանի որ իմ ընթերցողը ինձ սահմանում է։ ուզեմ կամ չուզեմ։
գրել եմ բառարանների մասին, մի քիչ տեխնիկական, բայց՝ ընթերցողին է վերաբերում։

իսկ ուրիշ իմ թեմաներից անիմաստ է պատմել։
ես նոյնիսկ լաւ ծանօթների հետ իմ համար որոշ շատ կարեւոր թեմաներից չեմ խօսում։ այլեւս։ խօսում եմ իհարկէ՝ այն թեմաներից որ իրենց համար էլ են կարեւոր։

նոյն կերպ ինձ սահմանում էր իմ ընթերցողը ԿՄ֊ում, ուր ես գրում էի այն թեմաներով, որ ինձնից սպասում էին, կամ կհասկանային։ արդե՞օք ես վերջանում էի նրանով ինչ էի գրում։
նոյն կերպ ես անգլերէն գրում եմ սփիւռքում՝ այն թեմաներից, որ կընկալուեն։

անհամեմատ աւելի շատ բան այսօր իմ մէջ եմ պահում՝ ոչ թէ անձնական, ոչ թէ չուզող եւ ժլատ լինելուց, այլ դրանք, որ չեն ընկալուի։

հ․ գ․
յիշեցի՝ մի անգամ խոհանոցում ինձ ասացին՝ բա մենք այստեղ սպեկուլյացիաներով ենք միշտ զբաղւում, կատակում ենք, քննարկելով թէ ինչ ես նկարում։ (երբ անցնում եմ գալուց (գնալուց մարդ արդէն չկայ, չեն տեսնում), խցիկը ուսիս է)

դէ ուղարկեցի ինչ եմ նկարում։ արձագանքներ չկային։ մէկը գրեց՝ «քուլ փիքս»։ երեւի աւելի լաւ է աշխատանքի մտնելիս խցիկը պահել ուսապարկի մէջ, որ իզուր հարցեր չառաջանան, ես էլ պէտք չի լինի մտածեմ, ինչպէս դրանց հետ վարուել։

հ․ հ․ գ․

սա իրականում շատ վախենալու չէ։ պահանջարկի բացակայութիւնը վատ չէ, քանի որ չի խանգարում, չի շեղում ուրիշ բաների վրայ։ վախենալու է, եթէ լինի պահանջարկ, որը ստիպի ինձ աւելի շատ գրել ինչ֊որ ձեւով կամ թեմայով։ օրինակ, եթէ ես լինեմ ֆբ֊ում ես կը զարգացնեն իմ այն մասը, որը կընկալուի այն հարուստ շուկայի կողմից, ով ինձ կարող է այսօր լայքը շնորհել կամ չշնորհել։

ասք նոր արտօնագրի մասին

ինձ թւում է, GPLv3֊ի պատմական անհրաժեշտութիւնն առկայ էր։
անկախ նրանից, ինչպէս են տարբեր մարդիկ դրան վերաբերում, կան մարդիկ, ում այն պէտք է։ մարդիկ, ով չեն ուզում, որ իրենց գործն օգտագործուի սարք «արգելափակելու» համար։

նաեւ այլ միտք է պտտւում գլխիս մէջ․ դիկտատուրաները, աւտորիտար վարչակարգերը ազատ ծա օգտագործելու հակում ունեն։ ասենք, Հիւսիսային Կորէան ունի իր ցանցը, որը համացանցից հասանելի չէ, ունի իր Լինուքս դիստրիբուտիւը․ առաջինն օգնում է իշխանութեանը մեկուսացնել երկիրը, իսկ երկրորդը արդե՞օք չի մատնի կուսակցութեան գծին պատշաճ կերպով չհետեւած հեղինակին։

Դրան աւելանում է սանկցիաների տակ գտնուելու դէպքը․ եթէ կազմակերպութիւններին արգելւում է գործ անել այսինչ երկրի հետ, մասնաւորապէս՝ ծա վաճառել եւ սպասարկել այն, ապա ազատ ծա֊ն վարչակարգը կարող է օգտագործել, ասենք, քաղբանտարկեալներին գնդակահարելու ցուցակներ կազմելու համար։

այդ պատճառով, կարծում եմ, եւս մի արտօնագիր է պէտք, որն ասում է՝ «ես չեմ թոյլ տալիս, որ իմ կոդը օգտագործուի աւտորիտար ռեժիմի կողմից», կամ «քաղաքացիների սահմանադրական ազատութիւնները ոտնատակ անելու նպատակով»։ այստեղ հարց է առաջանում, ո՞վ է որոշում որ վարչակարգն է աւտորիտար կամ դիկտատուրա։ ինքը հեղինա՞կը նշի՝ ասենք Հիւսիսային Կորէայում չօգտագործել։ Թէ՞ յղուի տարբեր այլ կազմակերպութիւնների գնահատականներին։ Թէ՞ ինչ։

ու տենց։

թարմացում․ պարզւում է, Սթոլմանը մի երկու տող այդ մասին գրել է ու իմ հետ համամիտ չէ։

DSCF1569.RAF_M5P5HY_____

երբ մօտենում էի, նոյնիսկ առանց գլուխը բարձրացնելու, սկսեց պոչը թափ տալ ուրախութիւնից։ ընդհանուր առմամբ Արջուկը շատ պոզիտիւ եւ ուրախ շուն դուրս եկաւ։

_MG_0351.CR2_DKXRHY__k64

սովորաբար եկեղեցիներ չեմ նկարում, բայց այս նկարն ուզում էի անել։ ու ահաւոր տարօրինակ տեղից է արուած, ու ես ոնց ասեմ, շատ հաւասարակշռուած (ֆիզիկապէս) դիրքում չէի անելիս։

Աստղիկն ասաց, որ իրեն նոր աշխատատեղի աշխատողների տուեալների բազայի համար նկար է հարկաւոր։
ես մի քանի փորձ արեցի։ Նա դրանցից մէկն օգտագործեց։ Չգիտեմ որն է նա վերբեռնել, իսկ ես սա եմ հրապարակում, քանի որ այն աւելի իմ իմացած Աստղիկի մասին է։
(:

_MG_0315.CR2_HUPLHY

Առնո Ֆիշերն ասում էր՝ «Man muss nicht komponieren, die Welt ist die Komposition» բայց ինձ իրօք շատ բարդ էր սա նկարել։ Շունը հեռու կապած, ինչ֊որ դատարկ տեղ մինչեւ իրեն։ Ու յետոյ մտածեցի, իրօք, շան եւ տիրոջ մէջ տարածութիւն կայ, ու թող այսպէս էլ լինի, հրապարակեմ։

չոբանի շուն «պարզ լիճ»֊ի կայանատեղում

չոբանի շուն «պարզ լիճ»֊ի կայանատեղում

այս շան շատ աւելի յուզիչ նկարներ ունեմ։
ու նա շատ նեղուող ու նեղուած շուն է։
բնաւ ինքնավստահ ու ուրախ շուն չէ։
երբ յիշում եմ իրեն, ու առաւել եւս եթէ անձրեւում է, սիրտս ֆիզիկապէս ցաւում է։

ասք ենթագրեր հանելու մասին

գրում եմ որ չմոռանամ հիմնականում՝

ընկերներիցս մէկն ուզում էր կազմակերպել «Տղամարդիկ» ֆիլմի դիտում իր անգլախօս բարեկամների համար։ փտնրեց համացանցում անգլերէն ենթագրեր, եւ, բնականաբար, չգտաւ։

ապա որոշեց պատրաստել ենթագրերն ինքնուրոյն։ ինձ ասաց, որ եթէ գտնէր գոնէ ինչ֊որ լեզուով .srt նիշքեր, ապա անհամեմատ աւելի հեշտ կը լինէր անգլերէն վարկածը պատրաստել՝ առնուազն ժամանակի մասի վրայ ջանք ծախսել պէտք չէ՝ արդէն կայ։

ես ունէի «Տղամարդտանց» ինչ֊որ ռուսաստանում արտադրուած դի֊ւի֊դի֊ի պարունակութիւնն ինչ֊որ մի հեռու տեղ։ Գտայ, ստուգեցի՝ իրօք պարունակում է ռուսերէն ենթագրեր։

Գիտէի, որ դրանք լինում է .srt֊ի փոխակերպել, բայց չգիտէի ինչպէս։ Սկսեցի կարդալ, եւ ասեմ որ նկարագրուած ձեւերի մեծ մասն իմ մօտ չաշխատեց, ներառեալ avidemŭ եւ ogmrip֊ի օգտագործելը։

հիմա, ինչ եմ արել, որ ստացուել է՝

նախ, որպէսզի բացել դիւիդի֊ն ոչ թէ իսօ պատկերից,

mplayer dvd:// -dvd-device /ուղի/դէպի/այդ պանակը

, որտեղ video_ts պանակն է։

Նաեւ ստուգեցի, որ համարի հոսքն է՝ առաջինը ինչ֊որ ՌԴ դրօշով տեքստ էր, զգուշացնող ում տունն է, արտադրողի կարծիքով, բանտում։
Երրորդը հոսքը՝ ֆիլմն էր։
Ապա՝

mplayer dvd://3 -dvd-device Men -v -vo null -ao null | grep "subtitle"

Ստանում ենք՝

subtitle ( sid ): 0 language: ru
subtitle ( sid ): 1 language: ru
number of subtitles on disk: 2

Երբ փորձում էի “-slang 0” կամ “-slang 1”

mencoder dvd://3 -dvd-device Men -nosound -ovc frameno -o /dev/null -slang 0 -vobsubout mensubtitle

ստանում էի դատարկ ելքային նիշքեր։

-rw-r--r-- 1 noch noch  538 Մայ 18 12:11 mensubtitle.idx
-rw-r--r-- 1 noch noch    0 Մայ 18 12:11 mensubtitle.sub
# file mensubtitle.sub 
mensubtitle.sub: empty

Ապա փորձեցի “-slang ru” դրօշով՝

mencoder dvd://3 -dvd-device Men -nosound -ovc frameno -o /dev/null -slang ru -vobsubout mensubtitle

ու ահա, 1.4 մբ֊նոց ելք՝

-rw-r--r-- 1 noch noch  32K Մայ 18 16:02 mensubtitle2.srt
-rw-r--r-- 1 noch noch 1.4M Մայ 18 12:17 mensubtitle2.sub

Գուցէ այդ պատճառով էլ տապալւում էր ogmrip֊ը, երեւի համար էր նշում, իսկ յետոյ բողոքում, որ ելքային նիշքերը չի կիրառի քանի որ զրօական չափս ունեն։

ի՞նչ է իրենից ներկայացնում։ ահա թէ ինչ։

# file mensubtitle2.sub 
mensubtitle2.sub: MPEG sequence, v2, program multiplex

Պարզւում է, դիւիդի֊ի վրայ ենթագրերը չեն պահւում տեքստի տեսքով, այլ արդէն ռենդեր արած վիդեո֊ի տեսքով են։

Ու նուագարկիչը «օվերլեյ» է անում մի վիդեո հոսք միւսի վրայ։

Ով կը մտածէր։ Ահա սա այն մասին է, երբ ժողովրդի ստեղծած ազատ ֆորմատներն ու տեխնոլոգիաներն աւելի առաջադէմ են կորպորատիւներից։

Օկեյ, բա ինչպէ՞ս վերածենք դրանք տեքստի։ Պարզւում է, պէտք է տառաճանաչում (optical character recognition) անել։

տեղակայեցի tesseract, /etc/portage/package.use ֊ի մէջ աւելացնելով

app-text/tesseract -scrollview linguas_ru

քանի որ իմ /etc/portage/make.conf֊ի LINGUAS֊ը փոխել չեմ ուզում, եւ այնտեղ գրուած է՝ “hy hy_AM en en_GB”

եւ vobsub2srt ծրագիրը, որն, ի դէպ, Ջենթու համակարգերի համար տեղակայման սխալ նկարագրութիւն ունէր, եւ այդ նկարագրութիւնը ձեռքի հետ ուղղեցի։

Աւելի լաւ է «օվերլեյ» պատրաստէր, մէկ է գիտհաբ արդէն օգտագործում է, քան առաջարկէր հիմնական «փորթիջ» ծառի մէջ «եբիլդ» տեղադրել։
Սիրուն չի, Տարօն, չունի այդ կուլտուրան նախագծողը։

Հիմա՝

# vobsub2srt mensubtitle2
WARNING: Image too small 8, size: 411840 bytes, 720x0 pixels, expected at least 9x1
spudec: Error determining control type 0xd6.  Skipping -6 bytes.
Wrote Subtitles to 'mensubtitle2.srt'

Եւ ահա, պատրաստի ելքային նիշք՝

Տղամարդիկ_ենթագրեր_ռուսերէն

ու տենց։

Բարաթեանի անգլերէն֊հայերէն բառարանը

Այ֊այստեղ կայ Բարաթեանի բառարանի pdf նիշք։
Իր հետ, սակայն շատ բան չես անի՝ armscii-8 կոդաւորում, տպելու համար նախատեսուած ֆորմատ։

Իսկ մեզ (յուսով եմ ոչ միայն ինձ) կրկին պէտք է էլեկտրոնային ազատ ֆորմատի բառարան, չէ՞։ Ահա, ստացայ։

stardict_baratian0

Ներբեռնել ստարդիկտ ֆորմատով այստեղ։

ելատեքստը, որի միջոցով ստացայ տաբ֊երով բաժանուած նիշք՝ այստեղ։

եւ ինքը՝ տաբ֊երով բաժանուած նիշքը որպէս աղբիւր՝ այստեղ։

վայելէք։ (:

հ․ գ․
մի քիչ պատմեմ գործընթացի մասին։
նախ, ես փորձում էի կիրառել poppler փաթեթի pdftotext֊ը, փիդիէֆ նիշքից տեքստ ստանալու համար։
սակայն կար հիմնական երկու խնդիր․

առաջին խնդիրը՝ կոդաւորումների հետ խառնաշփոթն էր։ լռելեան pdftotext֊ը ենթադրում է որ -enc UTF-8 արգումենտը։ ի դէպ, առաջ դա -enc Latin1 էր։ Ինչեւէ, այդ դէպքում, տրանսկրիպցիան ճիշտ էր երեւում, իսկ բառարանի հայերէն armscii-8 տեքստը դառնում էր մուլտիբայթ անհասկանալի մի բան, ինչ֊որ փչացած կոդաւորում։
եթէ կիրառում էի -enc Latin1, ապա pdftotext֊ը միայն Latin1 սեգմենտի տառերն էր վերցնում գրքից, իսկ Լատին մէկի ոչ բոլոր նիշերն են ընկած armscii-8֊ի տիրոյթում, եւ տառերի մի մասը կորում էին։

լուծեցի այսպէս՝ երկու նիշք էի ստանում, utf-8 եւ ucs-2 արգումենտներով։ առաջինից վերցնում էի տրանսկրիպցիաները, երկրորդի մէջ ամէն armscii-8 նիշը դառնում էր երկու բայթ, որի առաջին բայթը 00 էր, իսկ երկրորդը՝ նոյն այդ armscii-8 նիշը, եւ այսպէս 00֊ն արհամարհելով լինում էր աշխատել։

երկրորդ խնդիրը՝ այդ տեքստը չափազանց ոչ ռեգուլյար տեսք ունէր, ու կոդի մէջ լիքը բացառութիւններ էի աւելացնում։
երբեմն տողերն էին խառնուած, իսկ մի անգամ, ասենք bethink բառի տրանսկրիպցիան, թռել֊գնացել էր էջի վերջը։
Եւ դա արդէն լուծւում էր միմիայն ահաւոր շատ բացառութիւններ եւ ֆիքսումներ անելով տեքստի մէջ։

Բնական է, ես սկսեցի ատել այդ կոդը։

Փորձեցի լիքը այլ գործիքներ փիդիէֆ֊ից տեքստ ստանալու համար, ներառեալ podofo, ghostscript, եւ abiword (որը պարզւում է կարելի է հրամանային տողից աշխատեցնել, ասել որ կոնուերտի, բայց դրա ելքը նոյնն էր, ինչ pdftotext֊ինը, հաւանաբար այն պոպլերից էր օգտւում)։
մնացածի ելքն էլ ինձ չէր բաւականացնում՝ էլի խառն էր եւ անորակ։

Պարզւում է, սիրելիներս, մենք չունենք լաւ աշխատող ազատ գործիք, որ կարողանում է փիդիէֆ֊ներից տեքստ հանել։ atril֊ում էլ երբ մի բառ նշում ես, ուրիշ տեղ է նշւում։ Այդ իմ նիշքի դէպքում, բնականաբար։ (:

Ստիպուած եղայ փորձել սեփականատիրական acroread։ Տեսնեմ՝ այն ունի հրամանային տողի արգումենտներ (acroread -help), բայց, աւաղ, կարողանում է այդպէս միայն postscript նիշք տալ, եւ ոչ թէ տեքստ։ Իր տուած postscript֊ի մէջ ինձ անհրաժեշտ բան չգտայ, շատ բարդ եւ խառը ելք էր։ Այդ ծրագիրը նաեւ կարող է տեքստ տալ, բայց ոչ հրամանային տողից, այլ file – save as text ընտրելով, ու այդ տեքստը բաւական լաւ կազմ ունի։

Այդ տեքստն էլ օգտագործեցի, կոդն էլ սիրունացաւ։ Դա այն չէ, ինչ ես ուզում էի, քանի որ հիմա ես գիտհաբի շտեմարանում ունեմ որպէս աղբիւր այդ ակրորեադի տուած տեքստը, իսկ ուզում էի քաշել կայքից բարաթեանի բառարանի փիդիէֆ֊ը՝ որ փիդիէֆ֊ից մինչեւ ելքային ստարդիկտ նիշքեր ամէնը կատարուի աւտոմատացուած։

Ակրոբատի ելքն էլ էր պարունակում փչացած կոդաւորում, ինչպէս եւ պոպլերինը, երբ UTF-8 կոդաւորումն է ընտրած։

Հայերէն տեքստը պարունակում էր տարօրինակ շատ c2 եւ c3 նիշեր։
Ուշադիր նայեցի, c2֊ին յաջորդող թիւը՝ դա եղած տառի armsci կոդն է։ իսկ c3֊ից յետոյ գտնուողը պարզ չի ինչպէս է փչացել։ յետոյ նկատեցի, որ overflow է եղել իր կոնուերտացիայի ժամանակ, որը ես կարող եմ կոմպենսացնել, c3֊ին յաջորդող նիշին գումարելով 64։

Ահա, այդ պատճառով իմ կոնուերտեր մոդուլը կատարելագործուեց, ու հիմա ունի corrupted ArmSCII-8 to UTF-8 կոնուերտող ֆունկցիա։

Մնացած մանրուքները լաւ չեմ յիշում։ Կուզէի գտնել լաւ կոնուերտեր ու գործընթացը դարձնել լրիւ աւտոմատ։