Kusy Ferenc: A Fórum Intézet és a digitalizálás

Gya­kor­la­ti­lag az em­ber egész kör­nye­ze­té­ben di­gi­tá­lis ada­tok, di­gi­tá­li­san ve­zé­relt gé­pek, di­gi­tá­lis adat­hor­do­zók egy­sze­rű­sí­tik – vagy bo­nyo­lít­ják – a min­den­na­pi mun­kát. Te­kint­ve mű­kö­dé­si el­vük egy­sze­rű­sé­gét, elő­ál­lí­tá­suk ol­csó­sá­gát és a meg­ta­ka­rí­tott idő fel­be­csül­he­tet­len men­­nyi­sé­gét, a di­gi­tá­lis be­ren­de­zé­sek az élet majd­nem min­den te­rü­le­té­ről ki­szo­rí­tot­ták az ana­lóg, il­let­ve a me­cha­ni­kus gé­pe­ket. Ar­ra va­ló te­kin­tet­tel, hogy a di­gi­tá­lis gé­pek­ben nincs szük­ség moz­gó al­kat­ré­szek­re (ez­ál­tal meg­szűn­nek a ko­pás okoz­ta pon­tat­lan­sá­gok), a gé­pek tel­jes élet­tar­ta­muk alatt ugyan­ar­ra a mi­nő­sé­gű mun­ká­ra al­kal­ma­sak. Ez a mun­ka­fo­lya­mat a vég­ered­mé­nyé­nél tű­nik fel­be­csül­he­tet­len ér­té­kű­nek.
Bár a di­gi­tá­lis gé­pek élet­tar­ta­ma (fej­lő­dé­sük nagy üte­mé­nek kö­szön­he­tő­en) je­len­tő­sen ke­ve­sebb, mint ana­lóg elő­de­i­ké (an­nak ide­jén egy ka­zet­tás mag­ne­to­font még tíz-ti­zen­öt év után is lel­ke­sen hasz­nál­tunk, bár a ka­zet­ták már agyon vol­tak gyűr­ve, a raj­tuk lé­vő hang­anyag már-már él­vez­he­tet­len­né vált), az újab­b, jobb mi­nő­sé­gű gép meg­vá­sár­lá­sa anya­gi­lag ke­vés­bé meg­ter­he­lő, sőt sok eset­ben nem is szük­ség­sze­rű. To­váb­bá le­he­tő­sé­günk nyílt a gé­pek tel­je­sít­mé­nyé­nek, mun­ká­juk mi­nő­sé­gé­nek tel­je­sen az igé­nye­ink­hez va­ló iga­zí­tá­sá­ra, a költ­sé­gek emel­ke­dé­se nél­kül, ami ter­mé­sze­te­sen elő­de­ik­nél szin­te le­he­tet­len volt.
A szá­mí­tó­gé­pek ma is hasz­nált fel­épí­té­se egy ma­gyar szár­ma­zá­sú ma­te­ma­ti­kus, Neu­mann Já­nos mun­ká­ja. A bu­da­pes­ti szü­le­té­sű ma­te­ma­ti­kus ma­te­ma­ti­kai te­het­sé­ge már a pes­ti evan­gé­li­kus gim­ná­zi­um­ban ki­bon­ta­ko­zott, édes­ap­ja még­is azt kí­ván­ta, hogy ve­gyész­mér­nök le­gyen be­lő­le. Ezért az érett­sé­gi után be­irat­ko­zott a zü­ric­hi mű­egye­tem­re, mi­köz­ben Ber­lin­ben és Bu­da­pes­ten ma­te­ma­ti­kát, fi­zi­kát és fi­lo­zó­fi­át hall­ga­tott. Csak­nem egyidőben sze­rez­te meg sváj­ci mér­nö­ki dip­lo­má­ját és a bu­da­pes­ti ma­te­ma­ti­kai dok­to­rá­tust. Neu­mann a mér­nök­to­vább­kép­ző in­té­zet­ben (Institute for Advanced Stud­ies – IAS) lett a ma­te­ma­ti­ka pro­fes­­szo­ra. A má­so­dik vi­lág­há­bo­rú alatt Neu­mann je­lent­ke­zett a Man­hat­tan-terv vég­re­haj­tá­sá­ra, az ame­ri­kai atom­bom­ba elő­ál­lí­tá­sá­ra; amely­nek kap­csán a lö­kés­hul­lá­mok­kal kap­cso­la­tos szá­mí­tá­so­kat vé­gez­te. Eb­ben az idő­ben már el­ké­szült né­hány jel­fo­gós szá­mí­tó­gép, mint pél­dá­ul a MARK-I, va­la­mint ren­del­ke­zé­sé­re állt egy me­cha­ni­kus ana­lóg szá­mí­tó­gép, a Bush-fé­le dif­fer­en­ciálanal­izá­tor, és szá­mos – ak­kor ál­ta­lá­no­san hasz­nált – elekt­ro­me­cha­ni­kus szá­mo­ló­gép is. Saj­nos, egyik­kel sem le­he­tett má­sod­per­cen­ként né­hány mű­ve­let­nél na­gyobb se­bes­sé­get el­ér­ni.
Neu­mann 1944-ben is­mer­ke­dett meg Her­mann Gold­stine-­nal, aki az aberdeeni kí­sér­le­ti lő­té­ren a lő- és bom­bá­zá­si táb­lá­za­tok szá­mí­tá­sa­it irá­nyí­tot­ta. Tő­le meg­tud­ta, hogy a had­se­reg a Penn­syl­vaniai Egye­te­men egy elekt­ro­ni­kus szá­molóberen­dezés – az ENIAC – ki­fej­lesz­té­sén dol­go­zik, s azt 1000 művelet/má­sod­perc se­bes­sé­gű­re ter­ve­zik. Neu­man­n-­nak épp egy ilyen gép­re volt szük­sé­ge. Egy év­vel ké­sőbb a pro­jekt igaz­ga­tó­ja lett. Neu­mann és Gold­s­tine et­től kezd­ve – egé­szen Neu­mann ha­lá­lá­ig – együtt dol­go­zott a szá­mí­tó­gé­pek fej­lesz­té­sén. Az ENIAC két ter­ve­ző­jé­vel, John W. Mauch­ly­val és Pres­pert J. Eck­ert­tel azon­ban együtt­mű­kö­dé­sük nem volt túl­sá­go­san szo­ros. Neu­mann nem já­rult hoz­zá ah­hoz, hogy az ő ál­ta­la fel­ta­lált tá­rolt prog­ram el­vét a né­gyük ne­vén sza­ba­dal­maz­tas­sák. Hogy meg­aka­dá­lyoz­za Mauch­ly és Eck­ert sza­ba­dal­maz­ta­tá­si szán­dé­kát, kö­zöl­te a le­írást, s ez­zel le­he­tet­len­né tet­te a sza­ba­dal­maz­ta­tást.
Neu­mann és Gold­s­tine Prince­ton­ban meg­al­kot­ta az IAS szá­mí­tó­gé­pet. Ez leg­in­kább ab­ban kü­lön­bö­zött a ko­ráb­bi két szá­mí­tó­gép­től, hogy pár­hu­za­mos mű­kö­dé­sű volt, te­hát sok­kal gyor­sab­ban szá­molt bár­me­lyik ko­ra­be­li szá­mí­tó­gép­nél, fel­épí­té­se pe­dig – fő vo­na­la­i­ban – meg­egye­zett a mai mo­dern szá­mí­tó­gép­eké­vel. Neu­mann vá­rat­la­nul be­te­ge­dett meg, ki­de­rült, tü­dő­rák­ja van. Be­teg­sé­ge alatt is fo­lya­ma­to­san A szá­mí­tó­gép és az agy cí­mű elő­adá­sán dol­go­zott. A kéz­irat, saj­nos, be­fe­je­zet­len ma­radt, Neu­mann 1957. feb­ru­ár 8-án meg­halt. Éle­tét és mun­kás­sá­gát má­ra szin­te tel­je­sen a szá­mí­tó­gép­pel kö­tik ös­­sze, pe­dig szám­ta­lan ma­te­ma­ti­kai de­fi­ní­ció meg­fo­gal­ma­zá­sa kö­tő­dik még a ne­vé­hez.
Neu­mann mun­kás­sá­gá­nak kö­szön­he­tő­en vált le­het­ővé az ada­tok óri­á­si men­­nyi­sé­gű tár­há­zá­nak lét­re­ho­zá­sa, hi­he­tet­le­nül kis he­lyen. Ami­kor ada­tok tá­ro­lá­sá­ról be­szé­lünk, alap­ve­tő­en lo­gi­kai ér­té­kek tá­ro­lá­sá­ról van szó. Ér­vé­nyes ez a szö­ve­gek, a ké­pek, a hang­fel­vé­te­lek, a fil­mek ese­té­ben is. Míg egy kép­nél az egy­mást kö­ve­tő kü­lön­bö­ző szí­nű kép­pon­to­kat kell meg­kü­lön­böz­tet­ni, ahol egy pont ér­té­ke a szín­mély­sé­gé­nek fe­lel meg, ad­dig a han­gok­nál a pont ér­té­ke frek­ven­ci­át je­löl. A kép meg­je­le­ní­té­sé­hez a gra­fi­kus kár­tya de­kó­dol­ja az ál­lo­mány tar­tal­mát, majd azt a kép­er­nyő­re ve­tí­ti, a hang­anyag­nál a hang­kár­tya vég­zi a de­kó­do­lást, a vég­ered­ményt pe­dig a repro­duk­torokból hall­hat­juk. A film nem más, mint a szem ér­zé­keny­sé­gé­nél na­gyobb se­bes­ség­ben (ami kb. 50 Hz) egy­mást kö­ve­tő ké­pek hal­ma­za, ami­hez azo­nos idő­ten­ge­lyen egy hang­ál­lo­mányt csa­to­lunk. A szö­veg elő­re definált ka­rak­te­rek (ASCII) de­kó­dolt meg­je­le­ní­té­se.
Mi­vel a szá­mí­tó­gé­pek és a raj­tuk hasz­nált ope­rá­ci­ós rend­sze­rek nem egy­sé­ge­sek, sőt a kom­pa­ti­bi­li­tás is csak nagy­vo­na­lak­ban szab­vá­nyo­sí­tott (pél­dá­ul egy Linux alatt tö­mö­rí­tett ál­lo­mányt nem tri­vi­á­lis Win­dows alatt ki­cso­ma­gol­ni), a di­gi­ta­li­zált ál­lo­má­nyo­kat aján­la­tos olyan ál­lo­má­nyok­ra ala­kí­ta­ni, ame­lye­ket bár­mi­lyen ope­rá­ci­ós rend­szer ke­zel­ni tud.

A Fó­rum In­té­zet és a dig­i­tal­izá­ció

In­té­ze­tünk öt éve kez­dett az ada­tok dig­i­tal­izá­ciójá­val fog­lal­koz­ni. Ek­kor­ra vált le­he­tő­vé olyan szá­mí­tó­gé­pek, il­let­ve pe­ri­fé­ri­ák be­szer­zé­se, me­lyek meg­fe­le­lő mi­nő­ség­ben ké­pe­sek az ada­tok fel­dol­go­zá­sá­ra. Ter­mé­sze­te­sen a tech­ni­ka fo­lya­ma­tos fej­lő­dé­sé­nek kö­szön­he­tő­en má­ra ezek a be­ren­de­zé­sek el­avul­tak, he­lyük­be újab­b, jobb mi­nő­sé­gű be­ren­de­zé­sek ke­rül­tek.
Ma az ada­tok fel­dol­go­zá­sát egy he­lyen, az in­té­zet­ben ki­ala­kí­tott iro­dá­ban vé­gez­zük. Há­rom szá­mí­tó­gép, két hor­doz­ha­tó szá­mí­tó­gép al­kot­ja a di­gi­ta­li­zá­lás­hoz szük­sé­ges be­ren­de­zé­sek alap­ját. Ezek mind­egyi­ke al­kal­mas ké­pek fel­dol­go­zá­sá­ra, szken­nelésére. Két szá­mí­tó­gé­pet egy 1,1 GHz-es pro­ces­­szor hajt, me­mó­ri­á­juk 256 MB SDRam, 133 MHz-es sí­nen. Mind­ket­tő­höz egy ne­ga­tí­vok szken­nelésére is al­kal­mas szken­ner van csat­la­koz­tat­va. Eze­ket a gé­pe­ket hasz­nál­juk ké­pek be­vi­te­lé­re. A fel­dol­go­zá­suk már rend­sze­rint a hor­doz­ha­tó szá­mí­tó­gé­pe­ken tör­té­nik, ez­zel op­ti­ma­li­zál­va a gé­pek mun­ka­ide­jét. Har­ma­dik szá­mí­tó­gé­pünk gyor­sabb, 2,1 GHz-es Celeron-process­zor­ral van fel­sze­rel­ve, bel­ső sín­je­i­nek frek­ven­ci­á­ja 266 MHz, me­mó­ri­á­ja 512 MB DDR. Eb­be a szá­mí­tó­gép­be egy Cre­ative hang­kár­tyát he­lyez­tünk, amely re­mek pa­ra­mé­te­re­i­vel al­kal­mas a hang­anyag­ok meg­fe­le­lő mi­nő­ség­ben tör­té­nő fel­dol­go­zá­sá­ra. A kom­mu­ni­ká­ci­ót a gé­pek kö­zött 100 Mbit-es há­ló­zat old­ja meg. Je­len­leg egy drót­nél­kü­li há­ló­zat ki­épí­té­sén dol­go­zunk. Bár en­nek a se­bes­sé­ge je­len­leg ki­sebb, mint 100 Mbit, a jö­vő­ben va­ló­szí­nű­leg ez vál­toz­ni fog, ki­épí­té­se és kar­ban­tar­tá­sa pe­dig költ­ség­kí­mé­lőbb, va­la­mint le­he­tő­vé te­szi az inter­net hasz­ná­la­tát bár­hol az épü­le­ten be­lül.
Az ada­ta­ink inter­neten tör­té­nő el­he­lye­zé­sét egy sa­ját szer­ver üze­mel­te­té­sé­vel ol­dot­tuk meg. Ez a szer­ver egy inter­net­szol­gál­tatónál van el­he­lyez­ve, pa­ra­mé­te­re­it te­kint­ve egy két­pro­ces­­szo­ros Xeon tí­pu­sú szá­mí­tó­gép, 2 GB DDR me­mó­ri­á­val, 533 MHz-es sín­nel, két, pár­hu­za­mo­san hasz­nált me­rev­le­mez­zel, ami az adat­vesz­tés el­len nyújt biz­ton­sá­got.
Má­ra si­ke­rült el­ér­nünk, hogy a most ké­szü­lő fel­vé­te­lek di­gi­tá­lis rög­zí­tők­kel ké­szül­nek, így azok fel­dol­go­zá­sa mi­ni­má­lis időt vesz igény­be. A di­gi­tá­lis fény­ké­pe­ző­gép al­kal­mas a kon­fe­ren­ci­ák, a kép­zé­sek do­ku­men­tá­ci­ó­já­nak el­ké­szí­té­sé­re, a di­gi­tá­lis hang­rög­zí­tők pe­dig a be­szél­ge­té­sek, az elő­adá­sok hang­anya­gá­nak rög­zí­té­sét te­szik le­he­tő­vé.

Ké­pek fel­dol­go­zá­sa

A ké­pek archivá­ció­ja, dig­i­tal­izá­ció­ja több, pár­ho­za­mo­san fu­tó mun­ka ered­mé­nye. El­ső lé­pés­ben a ké­pek nagy fel­bon­tá­sú szken­nelése tör­té­nik, ké­sőb­bi akár nyom­dai fel­hasz­ná­lás­ra is al­kal­mas mé­ret­ben. Ez mé­ret­től füg­gő­en 300-600 DPI (Dot per inch – kép­pont per hü­velyk), 16 mil­li­ós szín­mély­ség. Ne­ga­tí­vok szken­nelésénél ez a fel­bon­tás még na­gyobb, 2400 DPI. Sok eset­ben már az ere­de­ti kép mi­nő­sé­ge sem ki­elé­gí­tő, ezért a ké­pek fel­dol­go­zá­sá­ra spe­ci­á­lis kép­szer­kesz­tő prog­ra­mo­kat hasz­ná­lunk. Ezek túl­nyo­mó ré­sze in­gye­ne­sen le­tölt­he­tő az inter­netről. Le­he­tő­sé­get kí­nál­nak töb­bek kö­zött a kép éles­sé­gé­nek ja­ví­tá­sá­ra, a for­ga­tás­ra, a szí­nek éle­sí­té­sé­re, a kép­mé­ret vál­toz­ta­tá­sá­ra. Egy sé­rült, alig ki­ve­he­tő ne­ga­tív ese­tén ki­sebb­faj­ta cso­da vé­gez­he­tő ve­lük.
Ja­ví­tás után a ké­pek egy spe­ci­á­lis kó­dot kap­nak, amely alap­ján vis­­sza­ke­res­he­tő az ere­de­ti pél­dány, ha ar­ra szük­ség van. Az inter­neten va­ló el­érés­hez ezek­ből a ké­pek­ből két, mi­nő­sé­gé­ben és mé­re­té­ben ki­sebb kép ké­szül, in­for­ma­tív jel­leg­gel. Ezek mé­re­tre 150, il­let­ve 500 kép­pont szé­les­sé­gű­ek, és ará­nya­i­ban hoz­zá­iga­zo­dó ma­gas­sá­gú­ak. Fel­bon­tá­suk 72 DPI. Nyom­dai fel­hasz­ná­lás­ra al­kal­mat­la­nok, vi­szont nagy se­bes­sé­gű ke­re­sést, il­let­ve meg­je­le­ní­tést tesz­nek le­he­tő­vé a vi­lág­há­lón. A ké­pek ere­de­ti­je, amen­­nyi­ben nem jog­vé­dett, bár­ki szá­má­ra pos­táz­ha­tó vagy sze­mé­lye­sen meg­te­kint­he­tő a Bib­lio­the­ca Hun­gar­i­ca ar­chí­vu­má­ban.
Az ezt kö­ve­tő mun­ka a ké­pek­ből ké­szí­tett metaa­dat, tar­ta­lom­le­író ál­lo­mány. Ezek ké­szí­té­sé­vel in­té­ze­tünk mégc­sak nem­ré­gi­ben is­mer­ke­dett meg, di­gi­ta­li­zált ké­pe­ink nagy ré­szé­hez még­is si­ke­rült el­ké­szí­te­nünk eze­ket a le­író ál­lo­má­nyo­kat. A le­író ál­lo­mány le­he­tő­vé te­szi a plat­form­független (értsd ope­rá­ci­ós rend­szer­től füg­get­len) ke­re­sést, az ál­lo­mány tar­tal­má­nak meg­te­kin­té­sét. Ala­pul a Dub­lin Core-sz­ab­ványt hasz­nál­juk, me­lyet XML-állományba ül­tet­ve ké­szít­jük az egyes ké­pek le­író ál­lo­má­nya­it. A ke­re­sés­hez az NDA (Nem­ze­ti Di­gi­tá­lis Adat­tár) ke­re­ső mo­tor­ját hasz­nál­juk sa­ját weboldalunkon is. Az XML-állományokat rend­sze­re­sen to­váb­bít­juk az NDA adat­bá­zi­sá­ba, így ada­ta­ink itt is meg­te­kint­he­tők.
Je­len­leg a fel­dol­go­zott, le­író ál­lo­mán­­nyal el­lá­tott ké­pek szá­ma:
– Fó­rum In­té­zet (kon­fe­ren­ci­ák, klu­bok stb.) – 7287 db
– Bib­lio­the­ca Hun­gar­i­ca ké­pes­lap­gyűj­te­mé­nye – 2386 db
– Szak­rá­lis kis­em­lék ar­chí­vum – 281 db
– Cse­ma­dok-ar­chí­vum (di­gi­ta­li­zál­va) – 7681 db
– Gyö­ke­res Györ­gy kép­ar­chí­vu­ma – 452 db
– Arany A. Lász­ló zob­o­ralji ké­pe­i­nek gyűj­te­mé­nye (szí­nes dia) – 680 db
Fel­dol­go­zás­ra vár:
– Cse­ma­dok-ar­chí­vum
– Szőt­tes-ar­chí­vum
– Egyé­ni ha­gya­té­kok
– Arany A. Lász­ló zob­o­ralji ké­pei (újabb 46 cso­mag, kb. 2500 kép­koc­ka)
A Fó­rum Ki­sebb­ség­ku­ta­tó In­té­zet fo­tó­ar­chí­vu­mát el­ső­sor­ban az in­té­zet éle­té­vel kap­cso­la­tos fel­vé­te­lek ké­pe­zik, a kü­lön­bö­ző kon­fe­ren­ci­ák fo­tó­do­ku­men­tá­ci­ó­ja, a klub­es­te­ken ké­szí­tett fel­vé­te­lek és egyéb, az in­té­zet éle­té­vel kap­cso­la­tos fel­vé­te­lek.
A Bib­lio­the­ca Hun­gar­i­ca ké­pes­lap­gyűj­te­mé­nye tel­jes egé­szé­ben fel­dol­go­zás­ra ke­rült, meg­te­kint­he­tő az inter­neten. Ez a gyűj­te­mény el­ső­sor­ban a dél-szlo­vá­ki­ai fal­vak, vá­ro­sok ál­tal meg­je­len­te­tett ké­pes­la­po­kat fog­lal­ja ma­gá­ba. Ál­lan­dó­an bő­vül, az új da­ra­bok szin­te azon­nal fel­ke­rül­nek az inter­ne­tre. A vi­lág­há­lón 500 kép­pont szé­les­sé­gű mé­ret­ben ta­lál­ha­tók meg, a ki­vá­lasz­tott da­rab­ból má­so­la­tot a Bib­lio­the­ca Hun­gar­icában le­het be­sze­rez­ni. A gyűj­te­mény egy ré­sze ná­lunk csak di­gi­tá­lis for­má­ban ta­lál­ha­tó meg.
Az Et­no­ló­gi­ai Köz­pont már évek óta fog­lal­ko­zik a dél-szlo­vá­ki­ai szak­rá­lis kis­em­lé­kek fény­ké­pe­zé­sé­vel. Gyűj­te­mé­nyük egye­dül­ál­ló. Az utób­bi évek­ben már di­gi­tá­lis fény­ké­pe­ző­gép se­gít­sé­gé­vel örö­kí­tik meg az utak mel­lett ta­lál­ha­tó ke­resz­te­ket, a szen­tek szob­ra­it. A ré­geb­ben ké­szült fel­vé­te­lek fo­lya­ma­to­san ke­rül­nek fel­dol­go­zás­ra. Mun­ká­juk ered­mé­nye több kö­tet­ben is meg­je­lent.
Gyö­ke­res Györ­gy hos­­szú éve­kig fo­tó­zás­sal fog­lal­ko­zott. Az ő sze­mé­lyes ar­chí­vu­ma gyűj­te­mé­nyünk egy ér­té­kes da­rab­ja. Fel­vé­te­le­in el­ső­sor­ban a Cse­ma­dok ál­tal szer­ve­zett fesz­ti­vá­lok, prog­ra­mok je­len­nek meg, de az ő ér­de­me a fel­vi­dé­ki írók port­ré­gyűj­te­mé­nye is. Ez a gyűj­te­mény tel­jes egé­szé­ben di­gi­ta­li­zált, TIFF-formátumban, nagy, 600 DPI-s fel­bon­tás­ban az in­té­zet ar­chí­vu­má­ban ta­lál­ha­tó meg.
Arany A. Lász­ló a má­so­dik vi­lág­há­bo­rú éve­i­ben fog­lal­ko­zott a zob­o­ralji fal­vak fo­tó­zá­sá­val. A fel­be­csül­he­tet­len ér­té­kű kép­anyag ne­ga­tí­vok for­má­já­ban áll in­té­ze­tünk ren­del­ke­zé­sé­re. A fel­vé­te­le­ken meg­ta­lál­ha­tó az ap­ró­lé­ko­san le­fo­tó­zott női, il­let­ve fér­fi­vi­se­let, több zob­o­ralji fa­lu­ból, va­la­mint a ko­ra­be­li élet ap­ró moz­za­na­tai, a min­den­na­pi mun­ka ké­pei. A gyűj­te­mény a zob­o­ralji élet egy ér­té­kes ar­chí­vu­ma. Az anyag nagy ré­sze már fel­dol­go­zás­ra ke­rült, több ki­ál­lí­tás alap­ját is ké­pez­te, el­ső­sor­ban a Zob­o­ralján. Nem­ré­gi­ben újab­b, több mint 2000 ké­pet szám­lá­ló cso­mag ke­rült in­té­ze­tünk­be, ezek di­gi­ta­li­zá­lá­sa fo­lya­mat­ban van. A tel­jes kép­anyag rész­le­tes, át­fo­gó gyűj­te­mény a zob­o­ralji fal­vak éle­té­ről.
Hang­anyag­ok fel­dol­go­zá­sa

A hang­anya­go­kat a már fent em­lí­tett Cre­ative tí­pu­sú hang­kár­tya se­gít­sé­gé­vel dol­goz­zuk fel. Az elő­nye ab­ban rej­lik, hogy ké­pes akár 96 kHz-es tar­to­má­nyo­kat is rög­zí­te­ni, el­len­ben a klas­­szi­kus 44 kHz-es hang­tar­to­mán­­nyal. Ez je­len­tős mi­nő­ség­be­li ja­vu­lást ered­mé­nyez. Bár az em­be­ri fül szá­má­ra a ha­tárt a 20 kHz-es hang­tar­to­mány ké­pe­zi, még­is va­la­mi­ként ér­zé­kel­jük az e fö­löt­ti tar­to­má­nyo­kat is (gon­do­lok itt el­ső­sor­ban a ba­ke­lit­le­me­zek sa­já­tos sú­gá­sá­ra, ami dig­i­tal­izá­ciókor más tí­pu­sú kár­tyá­val el­ve­szik). Ter­mé­sze­te­sen a hang­kár­tya e tu­laj­don­sá­ga csak in­do­kolt eset­ben van ki­hasz­nál­va, te­kint­ve, hogy a hang­ál­lo­má­nyo­kat sű­rí­te­ni kell, ez­ál­tal nyújt­va le­he­tő­sé­get az inter­netes el­érés­re. Sű­rí­tés­re je­len­leg az MP3-as for­má­tu­mot hasz­nál­juk, 192 kbit/s-os adat­sű­rű­ség mel­lett.
Az ar­chí­vum ré­szét ké­pe­zik:
– Si­ma Fe­renc gyűj­té­sei (nyelv­já­rá­si szö­ve­gek);
– Cse­ma­dok-gyűj­té­sek (nyelv­já­rá­si szö­ve­gek);
– a Pát­ria Rá­dió ál­tal ké­szí­tett ri­por­tok;
– egyé­ni ha­gya­té­kok, fel­vé­te­lek;
– Oral His­to­ry (be­szél­ge­té­sek Szlo­vá­ki­á­ban élő írók­kal, po­li­ti­ku­sok­kal a rend­szer­vál­tás éve­i­ről).
Ki­hasz­nál­va a di­gi­tá­lis hang­rög­zí­tők elő­nye­it, az Oral His­to­ry-­sorozat már di­gi­tá­li­san is ké­szül. Az ezek­hez tar­to­zó le­írá­sok pár­hu­za­mo­san a fel­vé­tel­lel ké­szül­nek. Te­kint­ve eme ri­por­tok mé­re­tét, egy­elő­re a vi­lág­há­lón nem el­ér­he­tők, ez a jö­vő­be­li fel­ada­ta­ink ré­sze. A tá­ro­lás MP3-as for­má­tum­ban, 44 kHz-en tör­té­nik. Itt nincs sem­mi­fé­le mi­nő­ség­be­li rom­lás az ana­lóg fel­vé­tel­hez ké­pest, te­kint­ve, hogy az em­ber hang­tar­to­má­nya 2000–5000 Hz kö­zé esik.
Si­ma Fe­renc 118 sza­lag­ból ál­ló nyelv­já­rá­si gyűj­te­mé­nye csak­nem tel­jes egé­szé­ben di­gi­ta­li­zá­lás­ra ke­rült, az egyes sza­la­gok több kü­lön ál­lo­mány­ra let­tek fel­oszt­va. Ezek mé­re­te és idő­tar­ta­ma a ri­por­tok hos­­szá­nak fe­lel meg. Egy sza­la­gon át­la­go­san 1,5-2 órá­nyi hang­anyag lett rög­zít­ve. Né­me­lyi­kük egy­sé­ges el­be­szé­lés, a töb­bin kü­lön­bö­ző ri­port­ala­nyok szó­lal­nak meg egy adott köz­ség­ből.
A Cse­ma­dok Né­pi Kö­re a hat­va­nas évek vé­gé­től a nyolc­va­nas évek ele­jé­ig ké­szí­tett fel­vé­te­le­ket, fa­lu­si kö­zeg­ben. Az el­ső­sor­ban el­be­szé­lé­se­ket, az élet min­den­nap­ja­it tar­tal­ma­zó fel­vé­te­le­ket 61 mag­nó­sza­la­gon rög­zí­tet­ték. Saj­nos pon­tos le­írás ezek­ről a hang­ál­lo­má­nyok­ról nem áll ren­del­ke­zé­sünk­re, így csak azt tud­tuk le­ír­ni, ami a mag­nó­sza­la­go­kon el­hang­zott. A gyűj­te­mény nem tel­jes, 47 sza­lag ke­rült di­gi­ta­li­zá­lás­ra.
A Pát­ria Rá­dió ál­tal fel­vett ri­por­tok 193 mag­nó­sza­la­gon ta­lál­ha­tók, egy­elő­re fel­dol­go­zás alat­t. A vá­gott, su­gár­zott ri­por­tok hos­­sza 10-15 perc, de sok eset­ben a vá­gat­lan anyag is meg­ta­lál­ha­tó ar­chí­vu­munk­ban. Ezek­ről a fel­vé­te­lek­ről – há­la a Pát­ria Rá­dió mun­ka­tár­sai pre­ci­zi­tá­sá­nak – pon­tos ada­ta­ink van­nak, fel­dol­go­zá­suk az el­kö­vet­ke­ző hó­na­pok­ban meg­tör­té­nik.
Szer­ve­rünk ka­pa­ci­tá­sa egy­elő­re nem te­szi le­he­tő­vé a hang­anyag­ok el­éré­sét a vi­lág­há­lón. A tel­jes anyag mé­re­te óri­á­si, több száz GB. Ezek szer­ve­ren va­ló el­he­lye­zé­sét a jö­vő év­ben ter­vez­zük.

Ki­ad­vány­ok

A könyv­ki­adás, a pub­li­ká­ci­ók meg­je­len­te­té­se a Fó­rum Ki­sebb­ség­ku­ta­tó In­té­zet mun­ká­já­nak egy fon­tos ré­sze. Köny­ve­ink több so­ro­zat­ban je­len­nek meg, il­let­ve 1999-től rend­sze­re­sen meg­je­le­nik a Fó­rum Tár­sa­da­lom­tu­do­má­nyi Szem­le, amely­ben tu­do­má­nyos jel­le­gű írá­sok kap­nak he­lyet. A Ma­gyar Elekt­ro­ni­kus Könyv­tár­nak (MEK) PDF-formátumban küld­jük ki­ad­vá­nya­in­kat, így azok az ő weboldalukon is ol­vas­ha­tók.
Az Arcanum-­sorozat pél­dá­ja alap­ján mi is sze­ret­nénk sa­ját ki­ad­vá­nya­in­kat di­gi­tá­lis for­má­ban is meg­je­len­tet­ni. Ez egy szö­veg­ke­re­ső­vel el­lá­tott adat­bá­zis ki­ala­kí­tá­sát igé­ny­li. A köny­ve­ket és ta­nul­má­nyo­kat eb­ben az adat­bá­zis­ban el­he­lyez­ve, so­ro­za­ton­ként ten­nénk köz­zé, ez­ál­tal meg­kön­­nyít­ve a ke­re­sést és a tá­jé­ko­zó­dást az egyes szö­ve­gek­ben. A prog­ram ki­ala­kí­tá­sa fo­lya­mat­ban van, je­len­leg az egyes köny­vek fel­töl­té­sé­vel fog­lal­ko­zunk.

Kon­fe­ren­ci­ák

A Fó­rum In­té­zet rend­sze­re­sen ren­dez kon­fe­ren­ci­á­kat, ér­tel­mi­sé­gi fó­ru­mo­kat, klub­es­te­ket. Ezek rög­zí­té­se, do­ku­men­tá­lá­sa szin­tén ré­szét ké­pe­zi a mun­kánk­nak. Az itt el­hang­zott elő­adá­so­kat a kez­de­tek­ben di­gi­tá­lis mag­nó se­gít­sé­gé­vel rög­zí­tet­tük, majd ké­sőbb ke­rül­tek tény­le­ges fel­dol­go­zás­ra, vá­gás­ra.
Má­ra ki­fej­lesz­tet­tünk egy fel­ve­vő­rend­szert, amely le­he­tő­vé te­szi a kon­fe­ren­ci­ák anya­gá­nak re­á­lis idő­ben tör­té­nő fel­dol­go­zá­sát. En­nek se­gít­sé­gé­vel a kon­fe­ren­cia vé­gez­té­vel el­ké­szül a kon­fe­ren­cia tel­jes kép­anya­gát és az el­hang­zott elő­adá­so­kat tar­tal­ma­zó CD, amit bár­ki ma­gá­val vi­het, hasz­nál­hat.
Ez a be­ren­de­zés gya­kor­la­ti­lag há­rom szá­mí­tó­gép, egy di­gi­tá­lis fény­ké­pe­ző­gép és a meg­hí­vó alap­ján elő­re el­ké­szí­tett prog­ram­fe­lü­let. Míg az egyik szá­mí­tó­gép a hang­anya­got rög­zí­ti, ad­dig a má­si­kon az elő­ző elő­adás vá­gá­sa, fel­dol­go­zá­sa fo­lyik, a har­ma­di­kon pe­dig a már el­ké­szült anyag be­töl­té­se a prog­ram­fe­lü­let­be. En­nek a mód­szer­nek a leg­na­gyobb elő­nye, hogy az egyes kon­fe­ren­ci­ák anya­gai azon­nal ar­chi­vá­lód­nak, ki­küsz­öböl­ve ez­zel az em­be­ri fe­le­dé­keny­ség okoz­ta adat­vesz­tést. A ké­sőb­bi­ek­ben ez az anyag is egy adat­bá­zis­ba ke­rül, majd egy ke­re­ső­vel egé­szül ki. Adat­hor­do­zón és inter­neten egy­aránt el­ér­he­tő­vé vá­lik.

Le­vél­tár és könyv­tár

Nem­ré­gi­ben in­dult el egy fo­lya­mat, amely a nyom­ta­tás­ban meg­je­lent szö­ve­gek fel­dol­go­zá­sát se­gí­te­né. A Bib­lio­the­ca Hun­gar­i­ca könyv-, il­let­ve fo­lyó­irat-gyűj­te­mé­nye je­len­leg nyom­ta­tott for­má­ban áll a ku­ta­tók ren­del­ke­zé­sé­re. Ezek di­gi­ta­li­zá­lá­sa ed­dig gya­kor­la­ti okok mi­att nem tör­tént meg. A szö­ve­gek új­ra­gé­pe­lé­se le­he­tet­len vál­lal­ko­zás­nak tű­nik, úgy­hogy egye­dül a szken­nelés je­len­te­ne meg­ol­dást. Csak­hogy így a szö­ve­ges do­ku­men­tu­mok kép­ként őr­ződ­nek, le­he­tet­len­né té­ve egy­faj­ta szö­veg­ke­re­ső lét­re­ho­zá­sát. A szö­veg­fel­is­me­rő szoft­ve­rek saj­nos túl nagy hi­ba­arán­­nyal dol­goz­tak ah­hoz, hogy egy ek­ko­ra adat­men­­nyi­ség mel­lett ér­dem­ben hasz­nál­ni le­hes­sen őket. Er­re a prob­lé­má­ra a Neu­mann Klub in­for­ma­ti­kai kö­re ajánlott ne­künk egy le­het­sé­ges meg­ol­dást. A Google in­gye­nes szö­veg­fel­is­me­rő mo­tor­ját ala­kít­ják át a Bib­lio­the­ca Hun­gar­i­ca igé­nye­i­nek meg­fe­le­lő­en. A gya­kor­lat­ban ez azt je­len­ti, hogy min­den nyom­ta­tás­ban meg­je­lent fo­lyó­irat­ra egy kü­lön szoft­ver lesz ki­ala­kít­va. Er­re azért van szük­ség, mert a kü­lön­bö­ző fo­lyó­irat­ok kü­lön­bö­ző el­ren­de­zé­sű­ek, va­la­mint kü­lön­bö­ző nyom­dák­ban ké­szül­tek, ez­ál­tal kü­lön­bö­ző be­tű­tí­pu­so­kat hasz­nál­tak. Ez­zel a mód­szer­rel elő­ze­tes szá­mí­tá­sa­ink sze­rint akár 98%-os pon­tos­sá­gú szö­veg­fel­is­me­rést érhetnénk eli, ami hi­he­tet­len mó­don gyor­sí­ta­ni tud­ná a di­gi­ta­li­zá­lás fo­lya­ma­tát. Eh­hez még egy A/3-as mé­re­tű szken­ner­re is szük­ség van. Az újab­b, jobb ál­la­pot­ban lé­vő do­ku­men­tu­mok, fo­lyó­irat­ok akár nagy tel­je­sít­mé­nyű lap­ol­va­só­val is fel­dol­goz­ha­tók. Egy­né­mely do­ku­men­tum mos­tan­ra saj­nos oly­an­­nyi­ra meg­ron­gá­ló­dott, hogy ezek be­vi­te­le csak kü­lön-kü­lön, la­pon­ként el­kép­zel­he­tő. Vég­ered­mény­ben a nem jog­vé­dett szö­ve­gek az inter­ne­tre ke­rül­het­né­nek, a re­gi­o­ná­lis vagy ré­geb­bi fo­lyó­irat­ok gyűj­te­mény­ként DVD-n is el­ér­he­tő­vé vál­ná­nak bár­ki szá­má­ra.