The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги ]

05.10.2011 16:59  Компания Oracle представила NoSQL-решение на базе Berkeley DB, Apache Hadoop и R

Компания Oracle анонсировала новую платформу для организации хранения больших объемов данных - Oracle Big Data Appliance, позволяющую организовать надежное хранение и анализ петабайтов данных. Решение позволяет обеспечить горизонтальную масштабируемость (при необходимости увеличения хранилища в кластер добавляются новые узлы), высокую надежность хранения (данные дублируются на нескольких узлах) и отсутствие единой точки отказа (в синхронном состоянии поддерживаются несколько узлов репликации).

Платформа функционирует на базе Oracle Linux и построена на базе следующих открытых компонентов:

  • Для организации распределенного отказоустойчивого хранилища задействована платформа Apache Hadoop, базирующаяся на парадигме map/reduce;
  • Для управления данными поверх кластера Hadoop запускается БД Oracle NoSQL Database, основанная на Java-варианте открытой БД BerkeleyDB (Oracle Berkeley DB Java Edition), оперирующая данными в формате ключ/значение и позволяющая гарантировать целостность и атомарность выполняемых транзакций;
  • Для анализа и статистической обработки данных предлагается использовать язык программирования R (поставляется открытый пакет Oracle R Enterprise, отличающийся адаптацией для работы с данными в кластере Hadoop).


  1. Главная ссылка к новости (http://www.oracle.com/us/corpo...)
Лицензия: CC-BY
Тип: К сведению
Ключевые слова: oracle, nosql, hadoop, berkeleydb
При перепечатке указание ссылки на opennet.ru обязательно
Обсуждение Линейный вид | Ajax | Показать все | RSS
 
  • 1.1, Там ничего, 20:10, 05/10/2011 [ответить] [смотреть все]
  • +1 +/
    Эх, эта мода на NoSQL...
     
     
  • 2.5, Avator, 05:47, 06/10/2011 [^] [ответить] [смотреть все]
  • +1 +/
    Да уж, причем называют этим термином всё подряд. Принципиально отличные друг от друга системы. =)
     
  • 2.9, umbr, 14:53, 08/10/2011 [^] [ответить] [смотреть все]
  • +/
    >Эх, эта мода на NoSQL...

    И это пройдет. (с)

     
  • 1.3, Клыкастый, 22:12, 05/10/2011 [ответить] [смотреть все]
  • +2 +/
    > ...запускается БД Oracle NoSQL Database, основанная на Java-варианте открытой БД BerkeleyDB...

    египетская сила...

     
  • 1.4, And, 04:35, 06/10/2011 [ответить] [смотреть все]
  • +/
    R работает не c Hadoop, а с базой Oracle.
    NoSQL DB тоже работает параллельно с Hadoop
     
  • 1.7, Аноним, 20:41, 06/10/2011 [ответить] [смотреть все]  
  • +/
    Вообще похоже опенсорс по направлению NoSQL все корпорации сделал под чистую ... весь текст скрыт [показать]
     
     
  • 2.8, umbr, 14:50, 08/10/2011 [^] [ответить] [смотреть все]  
  • +/
    Это вы проснулись :)
    Berkeley DB - очень старый движок.
     
  • 1.10, НихтАрбайтен, 14:43, 10/10/2011 [ответить] [смотреть все]  
  • +/
    Офигеть. Дайте две.

    Вообще-то, для обработки большого массива экспериментальных данных реляционность и даром не нужно. Так что SQL -- лесом. Более того и сам SQL слишком тяжеловесен, так что лесом аж 2 раза.

    Вот если бы можно было совместить семантику векторизации данных встроенную в сам язык (ну, как в R, например) с гибкой+долгоживущей индексацией (hash,B-tree,R-tree ...) и ACID-ностью, то цены б такому движку не было.

    К сожалению (я сужу только по сообщению, сам я его в руках не держал), в данном проекте всё было б хорошо, но вот гибкая индексация провисает. BDB слишком примитивный движок, чтоб встроить в него R-index. Т.е. там как минимум должна быть индексация по двум и более ключам одновременно.

     
     
  • 2.11, zooloo, 11:30, 25/10/2011 [^] [ответить] [смотреть все]  
  • +/
    BerkeleyDB поддерживает несколько индексов на таблицу. В терминологии BerkeleyDB дополнительный индекс называется secondary database. Таблица в терминологии BerkeleyDB называется primary database. Чтобы BerkeleyDB сам обновлял дополнительный индекс при обновлении таблицы, при создании дополнительного индекса надо указать функцию экстракции ключа (key extractor) для дополнительного индекса. Таблица может иметь один тип организации (в терминологии BerkeleyDB - метод доступа), например RECNO, а дополнительный индекс может иметь другой тип организации, например, BTREE.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Заголовок:
    Текст:


      Закладки на сайте
      Проследить за страницей
    Created 1996-2017 by Maxim Chirkov  
    ДобавитьРекламаВебмастеруГИД  
    Hosting by Ihor