|
Az Üzleti Sajtószolgálat (Original Text Service - OTS) üzleti vállakozások, cégek, intézmények közleményeit, tájékoztatóit, meghívóit, állásfoglalásait közli. Szolgáltatásunk segítségével több mint 2000 újságírót és kommunikációs szakembert érhet el könnyen, gyorsan és költséghatékonyan – az Ön által megfogalmazott sajtóközleményt változtatás nélkül juttatjuk el az MTI-előfizetők szerkesztőségi rendszerébe vagy igény szerint akár a külföldi sajtóhoz is. (Az OTS anyagai nem képezik az MTI-kiadás részét, a szó szerint továbbított szövegekért minden esetben a közlő a felelős.)
|
|
 |
| 2012. június 19., kedd 10:11 |
 A világ a Wikipedia szemüvegén keresztül (1.rész) |
|
| Hamburg, Németország, 2012. június 19., kedd (Business Wire/OTS)
- Mit végezhetünk el egy nap alatt a világ legnagyobb in-memory
adatbányászó rendszere, az új SGI® UV™ 2000 segítségével?
/Nemzetközi Supercomputing Konferencia 2012 |
A műszaki számítástechnikai megoldások terén elismert vezető cég, az
SGI (NASDAQ:SGI) összefogott az Illinois Egyetem munkatársával,
Kalev H. Leetaruval, hogy a világon elsőként elkészítsék a Wikipédia
angol nyelvű változatának történelmi térképét, és feltárják a
szövegtartalmakat mind térben, mind időben. Az eredmények közt van a
modernkori történelem képi megjelenítése egynapos adatbányászati
technikák alkalmazása révén. A Wikipedia teljes angol nyelvű
változatának feltöltésével az SGI® UV™ 2000-be, Leetaru úr
bemutatta, hogyan látta/láttatta a Wikipedia az elmúlt kétszáz év
történelmét. A hivatkozásokhoz hozzákapcsolták a helyszínt, az évet
és a pozitív vagy negatív hangulatot. Bár korábban már több projekt keretében is feltérképezték a
Wikipédia cikkeit kézileg, egy szerkesztő által hozzárendelt
metaadatok segítségével, ezek a korábbi kísérletek a Wikipédia
helyszínekre vonatkozó adatainak csak egy töredékét tudták
feldolgozni. A jelenlegi projekt keretében azonban "dekódolták" a
cikkek tartalmát, azonosítva a négy millió oldalon szereplő összes
helyszínt és dátumot, és a köztük fennálló kapcsolatokat, melynek
eredményeként egy masszív adathálót kaptak.
A Wikipédia teljesen új szemszögből
"Ezzel az elemzéssel lehetővé válik az emberiség számára, hogy
"hátralépjen egy lépést", azaz elvonatkoztasson az egyes cikkek és
szövegek egyedi vonásaitól, és az egyes lapokon szereplő elszigetelt
információk, azaz a 'fa' helyett az 'erdőt' lássa: azt a hatalmas
tudásanyagot, amely a Wikipédiában felhalmozódott. Figyelemmel
kísérhetjük, hogyan fejlődött az emberi tudás egyik legnagyobb
tárháza, és láthatunk olyan dolgokat, amiket még soha ezelőtt:
például az általános hangulatot egy adott időben és helyen, vagy
hogy hol vannak még tudásunkban "vakfoltok" - magyarázta Franz Aman,
az SGI értékesítési és stratégiai igazgatója." A Google Earth
alkalmazást azért szeretjük, mert kisebbre véve a felbontást nagyobb
léptékű képet kaphatunk. Az SGI UV 2 segítségével ugyanezt
megtehetjük az átfogó adatokkal, hogy azok alapján "átfogó" képet
kapjunk."
Az elemzés azt mutatja, hogy a Wikipédia négy fejlődési szakaszon
ment keresztül a történelmi események rögzítését illetően: 1001-1500
(Középkor), 1501-1729 (Korai modernkor), 1730-2003 (A Felvilágosodás
kora), 2004-2011 (a Wikipédia Éra) és mostani fejlődése a történelmi
események alaposabb lefedését célozza ahelyett, hogy a jelen
történéseit dokumentálná bővebben. A Wikipédia általános hangvétele,
hangulata az egyes évek krónikájának rögzítésében szorosan követi a
főbb nemzetközi eseményeket. Az elmúlt 1000 évben a legnegatívabb
hangulatú az Amerikai Polgárháború, majd a II. Világháború idején
volt. Az elemzés azt is kimutatja, hogy az ún. "szerzői jogi
szakadék", amely miatt a 20. századra vonatkozó digitalizált
nyomtatott szövegek nagy része nem követhető, nem jelent problémát a
Wikipédia esetében, ahol folyamatos, exponenciális növekedés
figyelhető meg az 1924-es évtől kezdve a mai napig rögzített cikkek,
bejegyzések tekintetében.
A kutatók az átfogó adatokat most már nagy sebességgel
bányászhatják
"A Wikipédia egyirányú kapcsolódásai, a kapcsolódások hiánya, és az
Infódobozok egyenetlen eloszlása egyaránt azt mutatja, hogy az olyan
gyűjtemények, mint a Wikipédia esetében a metaadatokon alapuló
adatbányászatnak megvannak a maga korlátai," - fejtette ki Leetaru
úr. "Az SGI UV 2 nagy megosztott memóriája révén a teljes
adatkészletre vonatkozó kérdéseket tehettem fel gyakorlatilag valós
időben. A rendelkezésemre álló hatalmas cache-koherens megosztott
memória lehetővé tette számomra, hogy néhány soros kódot írva a
teljes adathalmazon átfuttassak bármilyen kérdést, ami csak az
eszembe jut. Erre egy horizontális skálázású megközelítéssel nem
lett volna esélyem. Hasonlatképpen a számítógépes szövegszerkesztő
program és az írógép közti hatalmas funkcionalitásbeli különbséget
tudnám felhozni - amely fennáll az SGI UV 2 és más számítógépek közt
- az UV 2-t használva teljesen máshogy végezhetem a kutatást, és a
kimenetekre összpontosíthatok az algoritmusok helyett."(folyt.)
|
|
|
|
|
|
|
| 2012. június 19., kedd 10:12 |
 A világ a Wikipedia szemüvegén keresztül (2.rész) |
|
| |
Az alkalmazott elemzési módszer
Az SGI® UV™ 2000 szuperszámítógépbe való feltöltést követően ez
rendkívül nagy adathalmaz teljes szöveg-geokódoláson és
dátum-kódoláson esett át, olyan algoritmusok használatának
segítségével, amelyek minden megemlített helyszínt és dátumot
azonosítottak a Wikipédia összes bejegyzésének szövegében. Több,
mint 80 millió helyszínt és 42 millió dátumot rögzítettünk
i.e.1000-től 2012-ig. Átlagosan 19 helyszín és 11 dátum szerepelt
egy-egy cikkben (minden 44 szó helyszínre, és minden 75 szó dátumra
vonatkozott). A dátumok és helyszínek közti kapcsolódásokat egy
masszív adathálóra vittük fel, amely a Wikipédia történelemről
alkotott nézeteit tükrözte. Ennek az eszköznek a segítségével
Leetaru úr majdhogynem valós idejű elemzést végezhetett az SGI UV
2-be feltöltött teljes adatbázisban abból a célból, hogy vizuális
térképet készítsen az idő- és helyadatok folyamáról, láttatva nem
csak a történelmi események kibontakozását, hanem a világ általános
hangulatát is az elmúlt ezer évben, és interaktív módon vizsgáljon
meg számos elméletet és kutatási kérdést alig egy napi munkával.
Az új SGI UV szuperszámítógép
Az SGI UV 2 termékcsalád lehetővé teszi a felhasználók számára,
hogy gyakorlatilag egy egyszerű munkaállomáshoz hasonlóan könnyen
kezelhető rendszer segítségével választ kapjanak akár a világ
legnehezebb problémáira is. Az Intel® Xeon® processzor E5 családját
tartalmazó, szabvány Linuxon futó, és számos tárolási opciót
biztosító SGI UV 2 teljes körű, ipari szabványokra épülő, nagy
számításigény kielégítésére alkalmas megoldást kínál.
A mindössze 16 magos és 32 gigabájt memóriával rendelkező belépő
szintű SGI UV 2 rendkívül egyszerűen, könnyen építhető tovább, és
zökkenőmentesen bővíthető. Ez a következő generációs platform az
előző generációhoz képest kétszer annyi (akár 4096) magot tartalmaz,
és négyszeres koherens főmemóriát (akár 64 terabájt), amely egy
egységes SSI rendszer in-memory működtetésére teszi képessé.Az SGI
UV 2 nyolc petabájt osztott memóriáig skálázható, és négy terabájtos
I/O rate csúcssávszélességével (14 PB/óra) az Amerikai Egyesült
Államok Kongresszusi Könyvtárának teljes nyomtatott anyagát
kevesebb, mint három másodperc alatt lenne képes letölteni.
A SGI UV 2000. SGI UV 20 a mai naptól kezdve bármikor megrendelhető,
akár már a mai napon is, és 2012 augusztusában szállítjuk. Kezdő ára
30.000 USA dollár.
Amit az SGI-ről tudni kell
A műszaki számítástechnikai megoldások terén elismert vezető
nemzetközi cég, az SGI célja ügyfelei támogatása a legbonyolultabb
üzleti és műszaki kihívások legyőzésében. További információkért
látogasson el az sgi.com internetes oldalra!
Kapcsolat a Twitteren (@sgi_corp), a Facebook
-on(facebook.com/sgiglobal), a YouTube-on (youtube.com/sgicorp) és
a LinkedInen.
Fényképes és videók az alábbi címen találhatók:
http://www.sgi.com/go/wikipedia
© Silicon Graphics International Corporation. Az SGI név és az SGI
logo a Silicon Graphics International Corp. vagy annak az Amerikai
Egyesült Államokban és/vagy más országokban működő leányvállalatai
védjegye vagy bejegyzett védjegye. Az Intel és a Xeon az Intel
Corporation bejegyzett védjegye. Minden egyéb védjegy az azt
birtokló vállalat tulajdona.
A képeket Kalev Leetaru úr bocsátotta rendelkezésre
Fénykép/Multimédia galléria:
http://www.businesswire.com/cgi-bin/mmg.cgi?eid=50313303&lang=en
Contacts Ogilvy Public Relations Meghan Fintland, 415-677-2704 SGImedia@ogilvy.com
E közlemény hivatalos, mérvadó változata az eredeti forrásnyelven
közzétett szöveg. A fordítás csak az olvasó kényelmét szolgálja, és
összevetendő a forrásnyelven írt szöveggel, amely az egyetlen jogi
érvénnyel bíró változat.
-------------------------------------------------------------------
Az OTS internetes oldalán található hírek, közlemények, fotók
a forrásmegjelöléssel (OTS) szabadon és korlátozás nélkül
felhasználhatók. Továbbközlés esetén a közzétevő köteles az átvett
anyagot tartalmának torzítása nélkül, félreérthetőséget,
rosszindulatú következtetéseket kizáró, az eredeti
szövegkörnyezetnek megfelelő módon feldolgozni és megjelentetni.
Az OTS hírek nem képezik az MTI hírkiadás részét, az MTI által
szó szerint továbbított tartalomért minden esetben a beadó a felelős. © Copyright MTI Zrt.
Az OTS szolgáltatással kapcsolatban további információt a
(06-1) 441-9050 telefonszámon vagy a ots@mti.hu elektronikus
levelező címen kaphat.
|
|
|
|
|
|
|
|
|
 |
 |