OTS Üzleti Sajtószolgálat
MTI - hírügynökség
2013. június 19. szerda
Ismertető
Az Üzleti Sajtószolgálat (Original Text Service - OTS) üzleti vállakozások, cégek, intézmények közleményeit, tájékoztatóit, meghívóit, állásfoglalásait közli. Szolgáltatásunk segítségével több mint 2000 újságírót és kommunikációs szakembert érhet el könnyen, gyorsan és költséghatékonyan – az Ön által megfogalmazott sajtóközleményt változtatás nélkül juttatjuk el az MTI-előfizetők szerkesztőségi rendszerébe vagy igény szerint akár a külföldi sajtóhoz is. (Az OTS anyagai nem képezik az MTI-kiadás részét, a szó szerint továbbított szövegekért minden esetben a közlő a felelős.)


2012. június 19., kedd 10:11

A világ a Wikipedia szemüvegén keresztül (1.rész)
    Hamburg, Németország, 2012. június 19., kedd (Business Wire/OTS) - Mit végezhetünk el egy nap alatt a világ legnagyobb in-memory adatbányászó rendszere, az új SGI® UV™ 2000 segítségével? /Nemzetközi Supercomputing Konferencia 2012

    A műszaki számítástechnikai megoldások terén elismert vezető cég, az SGI (NASDAQ:SGI) összefogott az Illinois Egyetem munkatársával, Kalev H. Leetaruval, hogy a világon elsőként elkészítsék a Wikipédia angol nyelvű változatának történelmi térképét, és feltárják a szövegtartalmakat mind térben, mind időben. Az eredmények közt van a modernkori történelem képi megjelenítése egynapos adatbányászati technikák alkalmazása révén. A Wikipedia teljes angol nyelvű változatának feltöltésével az SGI® UV™ 2000-be, Leetaru úr bemutatta, hogyan látta/láttatta a Wikipedia az elmúlt kétszáz év történelmét. A hivatkozásokhoz hozzákapcsolták a helyszínt, az évet és a pozitív vagy negatív hangulatot.
Bár korábban már több projekt keretében is feltérképezték a Wikipédia cikkeit kézileg, egy szerkesztő által hozzárendelt metaadatok segítségével, ezek a korábbi kísérletek a Wikipédia helyszínekre vonatkozó adatainak csak egy töredékét tudták feldolgozni. A jelenlegi projekt keretében azonban "dekódolták" a cikkek tartalmát, azonosítva a négy millió oldalon szereplő összes helyszínt és dátumot, és a köztük fennálló kapcsolatokat, melynek eredményeként egy masszív adathálót kaptak.


A Wikipédia teljesen új szemszögből

"Ezzel az elemzéssel lehetővé válik az emberiség számára, hogy "hátralépjen egy lépést", azaz elvonatkoztasson az egyes cikkek és szövegek egyedi vonásaitól, és az egyes lapokon szereplő elszigetelt információk, azaz a 'fa' helyett az 'erdőt' lássa: azt a hatalmas tudásanyagot, amely a Wikipédiában felhalmozódott. Figyelemmel kísérhetjük, hogyan fejlődött az emberi tudás egyik legnagyobb tárháza, és láthatunk olyan dolgokat, amiket még soha ezelőtt: például az általános hangulatot egy adott időben és helyen, vagy hogy hol vannak még tudásunkban "vakfoltok" - magyarázta Franz Aman, az SGI értékesítési és stratégiai igazgatója." A Google Earth alkalmazást azért szeretjük, mert kisebbre véve a felbontást nagyobb léptékű képet kaphatunk. Az SGI UV 2 segítségével ugyanezt megtehetjük az  átfogó  adatokkal, hogy azok alapján "átfogó" képet kapjunk."

Az elemzés azt mutatja, hogy a Wikipédia négy fejlődési szakaszon ment keresztül a történelmi események rögzítését illetően: 1001-1500 (Középkor), 1501-1729 (Korai modernkor), 1730-2003 (A Felvilágosodás kora), 2004-2011 (a Wikipédia Éra) és mostani fejlődése a történelmi események alaposabb lefedését célozza ahelyett, hogy a jelen történéseit dokumentálná bővebben. A Wikipédia általános hangvétele, hangulata az egyes évek krónikájának rögzítésében szorosan követi a főbb nemzetközi eseményeket. Az elmúlt 1000 évben a legnegatívabb hangulatú az Amerikai Polgárháború, majd a II. Világháború idején volt. Az elemzés azt is kimutatja, hogy az ún. "szerzői jogi szakadék", amely miatt a 20. századra vonatkozó digitalizált nyomtatott szövegek nagy része nem követhető, nem jelent problémát a Wikipédia esetében, ahol folyamatos, exponenciális növekedés figyelhető meg az 1924-es évtől kezdve a mai napig rögzített cikkek, bejegyzések tekintetében.


A kutatók az átfogó adatokat most már  nagy sebességgel   bányászhatják

"A Wikipédia egyirányú kapcsolódásai, a kapcsolódások hiánya, és az Infódobozok egyenetlen eloszlása egyaránt azt mutatja, hogy az olyan gyűjtemények, mint a Wikipédia esetében a metaadatokon alapuló adatbányászatnak megvannak a maga korlátai," - fejtette ki Leetaru úr. "Az SGI UV 2 nagy megosztott memóriája révén a teljes adatkészletre vonatkozó kérdéseket tehettem fel gyakorlatilag valós időben. A rendelkezésemre álló hatalmas cache-koherens megosztott memória lehetővé tette számomra, hogy néhány soros kódot írva a teljes adathalmazon átfuttassak bármilyen kérdést, ami csak az eszembe jut. Erre egy horizontális skálázású megközelítéssel nem lett volna esélyem. Hasonlatképpen a számítógépes szövegszerkesztő program és az írógép közti hatalmas funkcionalitásbeli különbséget tudnám felhozni - amely fennáll az SGI UV 2 és más számítógépek közt - az UV 2-t használva teljesen máshogy végezhetem a kutatást, és a kimenetekre összpontosíthatok az algoritmusok helyett."(folyt.)


2012. június 19., kedd 10:12

A világ a Wikipedia szemüvegén keresztül (2.rész)
    

    Az alkalmazott elemzési módszer

Az SGI® UV™ 2000 szuperszámítógépbe való feltöltést követően ez rendkívül nagy adathalmaz teljes szöveg-geokódoláson és dátum-kódoláson esett át, olyan algoritmusok használatának segítségével, amelyek minden megemlített helyszínt és dátumot azonosítottak a Wikipédia összes bejegyzésének szövegében. Több, mint 80 millió helyszínt és 42 millió dátumot rögzítettünk i.e.1000-től 2012-ig. Átlagosan 19 helyszín és 11 dátum szerepelt egy-egy cikkben (minden 44 szó helyszínre, és minden 75 szó dátumra vonatkozott). A dátumok és helyszínek közti kapcsolódásokat egy masszív adathálóra vittük fel, amely a Wikipédia történelemről alkotott nézeteit tükrözte. Ennek az eszköznek a segítségével Leetaru úr majdhogynem valós idejű elemzést végezhetett az SGI UV 2-be feltöltött teljes adatbázisban abból a célból, hogy vizuális térképet készítsen az idő- és helyadatok folyamáról, láttatva nem csak a történelmi események kibontakozását, hanem a világ általános hangulatát is az elmúlt ezer évben, és interaktív módon vizsgáljon meg számos elméletet és kutatási kérdést alig egy napi munkával.


Az új SGI UV szuperszámítógép

Az  SGI UV 2 termékcsalád lehetővé teszi a felhasználók számára, hogy gyakorlatilag egy egyszerű munkaállomáshoz hasonlóan könnyen kezelhető rendszer segítségével választ kapjanak akár a világ legnehezebb problémáira is. Az Intel® Xeon® processzor E5 családját tartalmazó, szabvány Linuxon futó, és számos tárolási opciót biztosító SGI UV 2 teljes körű, ipari szabványokra épülő, nagy számításigény kielégítésére alkalmas megoldást kínál.

A mindössze 16 magos és 32 gigabájt memóriával rendelkező belépő szintű SGI UV 2 rendkívül egyszerűen, könnyen építhető tovább, és zökkenőmentesen bővíthető. Ez a következő generációs platform az előző generációhoz képest kétszer annyi (akár 4096) magot tartalmaz, és négyszeres koherens főmemóriát (akár 64 terabájt), amely egy egységes SSI rendszer in-memory működtetésére teszi képessé.Az  SGI UV 2 nyolc petabájt osztott memóriáig skálázható, és négy terabájtos I/O rate csúcssávszélességével (14 PB/óra) az Amerikai Egyesült Államok Kongresszusi Könyvtárának teljes nyomtatott anyagát kevesebb, mint három másodperc alatt lenne képes letölteni.

A SGI UV 2000. SGI UV 20 a mai naptól kezdve bármikor megrendelhető, akár már a mai napon is, és 2012 augusztusában szállítjuk. Kezdő ára 30.000 USA dollár.


Amit az SGI-ről tudni kell

A műszaki számítástechnikai megoldások terén elismert vezető nemzetközi cég, az  SGI  célja ügyfelei támogatása a legbonyolultabb üzleti és műszaki kihívások legyőzésében. További információkért látogasson el az  sgi.com internetes oldalra!

Kapcsolat a Twitteren (@sgi_corp), a Facebook -on(facebook.com/sgiglobal), a YouTube-on  (youtube.com/sgicorp) és a LinkedInen.

Fényképes és videók az alábbi címen találhatók: http://www.sgi.com/go/wikipedia

© Silicon Graphics International Corporation. Az SGI név és az SGI logo a Silicon Graphics International Corp. vagy annak az Amerikai Egyesült Államokban és/vagy más országokban működő leányvállalatai védjegye vagy bejegyzett védjegye. Az Intel és a Xeon az Intel Corporation bejegyzett védjegye. Minden egyéb védjegy az azt birtokló vállalat tulajdona.

A képeket Kalev Leetaru úr bocsátotta rendelkezésre

Fénykép/Multimédia galléria: http://www.businesswire.com/cgi-bin/mmg.cgi?eid=50313303&lang=en


Contacts
Ogilvy Public Relations
Meghan Fintland, 415-677-2704
SGImedia@ogilvy.com



E közlemény hivatalos, mérvadó változata az eredeti forrásnyelven közzétett szöveg. A fordítás csak az olvasó kényelmét szolgálja, és összevetendő a forrásnyelven írt szöveggel, amely az egyetlen jogi érvénnyel bíró változat.
    

-------------------------------------------------------------------

      Az OTS internetes oldalán található hírek, közlemények, fotók a forrásmegjelöléssel (OTS) szabadon és korlátozás nélkül felhasználhatók. Továbbközlés esetén a közzétevő köteles az átvett anyagot tartalmának torzítása nélkül, félreérthetőséget, rosszindulatú következtetéseket kizáró, az eredeti szövegkörnyezetnek megfelelő módon feldolgozni és megjelentetni.
      Az OTS hírek nem képezik az MTI hírkiadás részét, az MTI által szó szerint továbbított tartalomért minden esetben a beadó a felelős.
© Copyright MTI Zrt.
      Az OTS szolgáltatással kapcsolatban további információt a (06-1) 441-9050 telefonszámon vagy a ots@mti.hu elektronikus levelező címen kaphat.
Vissza

Küldje tovább ismerősének

Nyomtatóbarát változat


RSS  ▪  Impresszum  ▪  MTI nonprofit Zrt. 2010  © Minden jog fenntartva.