https://frosthead.com

Велики подаци Једноставно постају већи јер ИБМ Ватсон задовољава Енциклопедију живота

Након 2.000 година, ултимативна енциклопедија живота је на врхунцу нове ере вођене подацима. Грантови Националне научне фондације додељени су Енциклопедији живота (ЕОЛ), ИБМ-у и Технолошком институту Џорџија. Грант ће омогућити да се огромне количине података обраде и умреже на индекс на начин који ће омогућити да се изврши револуционарна наука.

Сличан садржај

  • Предложени нови морски резерватни систем нуди розе изгледе и за јастога и за јастога

У 77. години нове ере Плиниј Старији почео је да пише прву енциклопедију на свету, Природну историју. Обухватало је све, од астрономије до ботанике, зоологије до антропологије и још много тога. Плиниј је покушао да све што је могао лично о природном свету обједини у једно писано дело. Током последњих 2000 година, дуги низ наследника научника инспирисаних Плинијем следио је исту визију.

Плиниј је у 36 свезака укључио 20.000 тема, али наишао је на ограничења онога што једна особа може открити, снимити и обрадити у току људског животног века. Умро је током ерупције планине Везув, пре него што је успео да доврши последњу монтажу свог магнум опуса. Ни у својој ери није било могуће да једна особа прочита све књиге, научи све ствари и објасни то свету.

Како су касније научници, уредници и библиотекари открили у свету који додаје више писменог знања са сваком наредном годином, чак и ако бисте могли да похраните све светске светске књиге и истраживања у једну зграду, изазов је да се све релевантне информације учине доступним истраживачи током ограничења њихових кратких људских живота.

ЕОЛ би то могла да промени применом врхунских рачунских моћи на раздвајање збирки биолошких података. Пројекат је бесплатна и отворена дигитална збирка чињеница, чланака и мултимедија о биодиверзитету, једна од највећих на свету. Са седиштем у Смитхсониан Институтион и са 357 партнера и добављача садржаја, укључујући Универзитет Харвард и Нову библиотеку Александрије у Египту, ЕОЛ је порастао са 30.000 страница када је представљен 2008. на више од два милиона, са 1, 3 милиона страница текста, мапа, видео, аудио и фотографије и подржава 20 језика.

„У Смитхсониан сам дошао 2010. године из софтверске индустрије, “ каже директор ЕОЛ-а Боб Цорриган. „Једно од открића које сам дошао овде је да, иако је ИТ свуда, она није продрла у музејски свет онако како је продрла у комерцијални свет. Посебно у биологији најважнији подаци су сахрањени у уџбеницима и прорачунским таблицама. "

Како се биолошки подаци у различитим облицима могу комбиновати и вадити за нове увиде о животу на Земљи? Шта ако су подаци о, рецимо, биолошкој разноликости лептира у Африци током деценије комбиновани са подацима о пољопривредним праксама и падавинама? Да ли би се могло нешто ново научити? За ово је потребно нешто веће од људског мозга. Нешто попут ИБМ-овог супер-рачунара Ватсон.

„ИБМ доприноси напорима и приступу верзији [Ватсона] која није јавно доступна“, каже Јеннифер Хаммоцк, директорица програма у ЕОЛ-у. „Они ће такође имати људе који раде на томе. ИБМ ово ради као допринос у натури. "

Ватсон је суперкомпјутер који не броји само велике бројеве. Користи вештачку интелигенцију како би омогућио корисницима да постављају питања на обичном језику.

"Рекао бих из корисничког становишта, то значи да је база података нешто до чега можете ићи и постављати питање као да сте од човјека", каже Хаммоцк. "Као, да ли ми можете рећи да ли се овај љубичасти лептир појављује у Африци?"

„Одговор на једноставно питање на било којем језику претпоставља постојање пуно знања иза кулиса“, каже Цорриган. „Чак и (реч) љубичаста, претпоставља се да знамо шта је љубичаста. Или лептир, [рачунар] мора да разуме разлику између лептира и мољаца. Поврх тога, сами сетови података имају различите начине размишљања о тим различитим терминима. Све ове податке тешко је било минирати без розета. А то је део магије онога што ЕОЛ ради. "

Једно научно питање за које се партнерство ЕОЛ-а, ИБМ-а и Георгиа Тецх нада да ће решити је парадокс планктона.

Према Хаммоцку, научници који раде с рачунарским симулацијама „покушавају да моделирају шта се дешава у океану рекавши да сунце сија и алге расту. . . Има неку грубу апроксимацију, али они не могу да постигну стабилност рачунарског модела екосистема. Они неко време одлазе и онда се сруше. Јер су превише једноставни. Надају се да ће, уколико могу да покажу мало више разноликости у својој моделираној биосфери, постати стабилнији. . . . парадокс је: како постоји биосфера океана? Зашто се не сруши? "

"Људи седе на подацима", каже Цорриган. „Има невероватних резервоара за мерење биолошке разноликости широм планете. Добијам пуно телефонских позива од људи који сједе на овим подацима и желе помоћ да их ставе у шири контекст. Важно је јер смо у трци да проучавамо ову планету и да научимо како наш развој наглашава наше врло ограничене ресурсе. . . Смитхсониан може играти улогу у повећању знања из свих ових извора и бити права снага за његово ширење. "

Четвртина грантова од милион долара биће додељена Смитхсониан-у за његов део посла, али ЕОЛ укључује много других играча. Неки програмери су у Египту; образовни тим је са Харварда; а јединица шпанског језика је у Мекицо Цитију.

Сви подаци ЕОЛ-а и даље ће бити или у јавном домену или под лиценцом Цреативе Цоммонс. Истраживање и подаци требају бити јавно доступни и не скривају се иза платног зида.

„То је врло стари сан“, каже Хаммоцк. „Један човек вероватно не може све то да научи. Тешко је све ставити на једно место где се свесно може проверити против себе. Али сада имамо рачунаре. "

Плиниј би био или врло задовољан или јако љубоморан.

Велики подаци Једноставно постају већи јер ИБМ Ватсон задовољава Енциклопедију живота