The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Компания Oracle представила NoSQL-решение на базе Berkeley DB, Apache Hadoop и R

05.10.2011 16:59

Компания Oracle анонсировала новую платформу для организации хранения больших объемов данных - Oracle Big Data Appliance, позволяющую организовать надежное хранение и анализ петабайтов данных. Решение позволяет обеспечить горизонтальную масштабируемость (при необходимости увеличения хранилища в кластер добавляются новые узлы), высокую надежность хранения (данные дублируются на нескольких узлах) и отсутствие единой точки отказа (в синхронном состоянии поддерживаются несколько узлов репликации).

Платформа функционирует на базе Oracle Linux и построена на базе следующих открытых компонентов:

  • Для организации распределенного отказоустойчивого хранилища задействована платформа Apache Hadoop, базирующаяся на парадигме map/reduce;
  • Для управления данными поверх кластера Hadoop запускается БД Oracle NoSQL Database, основанная на Java-варианте открытой БД BerkeleyDB (Oracle Berkeley DB Java Edition), оперирующая данными в формате ключ/значение и позволяющая гарантировать целостность и атомарность выполняемых транзакций;
  • Для анализа и статистической обработки данных предлагается использовать язык программирования R (поставляется открытый пакет Oracle R Enterprise, отличающийся адаптацией для работы с данными в кластере Hadoop).


  1. Главная ссылка к новости (http://www.oracle.com/us/corpo...)
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/31955-oracle
Ключевые слова: oracle, nosql, hadoop, berkeleydb
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (9) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Там ничего (?), 20:10, 05/10/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Эх, эта мода на NoSQL...
     
     
  • 2.5, Avator (ok), 05:47, 06/10/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Да уж, причем называют этим термином всё подряд. Принципиально отличные друг от друга системы. =)
     
  • 2.9, umbr (ok), 14:53, 08/10/2011 [^] [^^] [^^^] [ответить]  
  • +/
    >Эх, эта мода на NoSQL...

    И это пройдет. (с)

     

  • 1.3, Клыкастый (ok), 22:12, 05/10/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    > ...запускается БД Oracle NoSQL Database, основанная на Java-варианте открытой БД BerkeleyDB...

    египетская сила...

     
  • 1.4, And (??), 04:35, 06/10/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    R работает не c Hadoop, а с базой Oracle.
    NoSQL DB тоже работает параллельно с Hadoop
     
  • 1.7, Аноним (-), 20:41, 06/10/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Вообще похоже опенсорс по направлению NoSQL все корпорации "сделал" под чистую.
    Их уже вовсю используют в огромных проектав, а оракл только проснулся.
     
     
  • 2.8, umbr (ok), 14:50, 08/10/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Это вы проснулись :)
    Berkeley DB - очень старый движок.
     

  • 1.10, НихтАрбайтен (?), 14:43, 10/10/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Офигеть. Дайте две.

    Вообще-то, для обработки большого массива экспериментальных данных реляционность и даром не нужно. Так что SQL -- лесом. Более того и сам SQL слишком тяжеловесен, так что лесом аж 2 раза.

    Вот если бы можно было совместить семантику векторизации данных встроенную в сам язык (ну, как в R, например) с гибкой+долгоживущей индексацией (hash,B-tree,R-tree ...) и ACID-ностью, то цены б такому движку не было.

    К сожалению (я сужу только по сообщению, сам я его в руках не держал), в данном проекте всё было б хорошо, но вот гибкая индексация провисает. BDB слишком примитивный движок, чтоб встроить в него R-index. Т.е. там как минимум должна быть индексация по двум и более ключам одновременно.

     
     
  • 2.11, zooloo (?), 11:30, 25/10/2011 [^] [^^] [^^^] [ответить]  
  • +/
    BerkeleyDB поддерживает несколько индексов на таблицу. В терминологии BerkeleyDB дополнительный индекс называется secondary database. Таблица в терминологии BerkeleyDB называется primary database. Чтобы BerkeleyDB сам обновлял дополнительный индекс при обновлении таблицы, при создании дополнительного индекса надо указать функцию экстракции ключа (key extractor) для дополнительного индекса. Таблица может иметь один тип организации (в терминологии BerkeleyDB - метод доступа), например RECNO, а дополнительный индекс может иметь другой тип организации, например, BTREE.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру