Хранение данных *

Что имеем, то храним

СтатьиПостыНовостиАвторыКомпании

oneastok 6 часов назад

(Почти) идеальный мини-NAS для мини-стойки

Простой

5 мин

5.3K

Блог компании SelectelКомпьютерное железоХранение данных*Читальный зал

Обзор

Перевод

Мини-ПК GMKtec G9  N150 с четырьмя  отсеками NVMe стоит 240  долларов — практически идеальное NAS-устройство для домашней мини-стойки. Он оснащен четырехядерным процессором Intel N150  с интегрированной графикой Intel UHD среднего уровня, 12  ГБ оперативной памяти LPDDR5, двумя портами Ethernet 2,5  Гбит/с, WiFi  6  и, что самое приятное, четырьмя  встроенными слотами M.2  NVMe.

Казалось бы, что не так?

Читать дальше →

ShilovskyAnton вчера в 20:34

Делиться знаниями — значит расти. 6 шагов к построению базы знаний на основе DWH

Простой

8 мин

897

Хранилища данных*Хранение данных*Исследования и прогнозы в IT*Управление сообществом*Управление продуктом*

Кейс

Recovery Mode

Этот текст — эссенция практического опыта креативного специалиста, который помогает бизнесу находить технические решения в области построения базы знаний. Решил поделиться своими заметками об архитектуре хранилища данных (DWH) и написать, почему важно хранить корпоративные данные в едином хранилище, как преодолеть внутренние барьеры (вроде страха критики и синдрома самозванца) для начала обмена знаниями и какими техническими и организационными решениями можно сделать этот процесс удобным и полезным. В статье — живой опыт, конкретные советы и немного вдохновения для тех, кто только начинает делиться знаниями внутри команды.

DAN_SEA вчера в 16:01

Как сделать компьютерную память из ржавых гвоздей и нейросети — из медных проволок?

Средний

13 мин

4.4K

Блог компании RUVDS.comDIY или Сделай самПроизводство и разработка электроники*Разработка под Arduino*Хранение данных*

Обзор

Картинка — Kaboompics, Flatart, Freepik

Сегодня мы поговорим о таком интересном классе электронных компонентов, который носит название «мемристоры» и позволяет даже строить на их основе нейросети.

Их привлекательность заключается в том, что их вполне можно делать даже самостоятельно, из подручных компонентов.

В последнее время мы привыкли, что под понятием нейросетей подразумеваются определённые программные структуры. Однако мемристоры позволяют строить нейросети на физической основе! О_о

Аппаратные физические нейросети… Как вам такое? :-) Весьма близко к тому, что мы видим в природе, кстати говоря…

Читать дальше →

+29

qlever вчера в 15:42

Что такое Ansible и как применяется в DWH-проектах? Сравнение Ansible с Puppet, Chef, SaltStack

10 мин

2.4K

Big Data*Хранение данных*Хранилища данных*Системное администрирование*DevOps*

В статье рассказываем, что такое Ansible и как инструмент может применяться в проектах DWH: от автоматического развертывания и настройки компонентов до восстановления после сбоев и централизованного управления параметрами.

Сравниваем Ansible с другими инструментами для автоматизации управления инфраструктурой: Puppet, Chef, SaltStack.

GrishinAlex 16 апр в 15:05

Асинхронно копируем объекты между регионами S3 с помощью Python

Средний

6 мин

3.6K

Блог компании SelectelPython*Облачные сервисы*Хранение данных*Хранилища данных*

Обзор

Привет, Хабр! Я Александр Гришин, отвечаю за развитие облачных баз данных и объектного хранилища в Selectel. В своей практике часто сталкиваюсь с разными задачами клиентов. Среди них, например: реализовать репликацию данных между удаленными друг от друга регионами, отработать домен отказа «Регион» и повысить уровень отказоустойчивости своих сервисов, убрав привязку к одному городу и инфраструктуре. Сегодня я расскажу, как легко реализовать асинхронную репликацию данных в инфраструктуре Selectel, используя Python и boto3. Погнали!

Читать дальше →

+26

Tinkao 16 апр в 09:53

7 опорных функций, которые должны быть в вашей системе Data Governance

Средний

7 мин

495

Блог компании РСХБ.цифра (Россельхозбанк)Хранение данных*IT-стандарты*Управление проектами*Открытые данные*

Аналитика

Привет, Хабр! Я Татьяна, в РСХБ-Интех работаю с данными, в прошлый раз я рассказывала про свои любимые фреймворки для повышения эффективности бизнеса. В этот раз статья посвящена Data Governance.

Data Governance управляет не самими данными и их потоками, а метаданными, которые сопровождают их во всех точках ввода, обработки, хранения и перемещения, вплоть до уничтожения.

Наиболее прогрессивные компании сегодня имеют целые экосистемы по управлению жизненным циклом данных. Такие экосистемы могут включать в себя несколько приложений или программных продуктов, которые дирижируются Data Governance процессом, выстроенным внутри организации.

VASExperts 15 апр в 16:32

В Европе снова заговорили об отказе от американских платформ и суверенном облаке — анализ ситуации

Простой

5 мин

1.8K

Блог компании VAS ExpertsЗаконодательство в ITХостингОблачные сервисы*Хранение данных*

Аналитика

Разбираемся, в чем заключается проблема с точки зрения европейских регуляторов, какие попытки уже были предприняты и что в ЕС планируют делать дальше.

aabzel 15 апр в 14:28

NVRAM из EEPROM

Простой

3 мин

2.4K

Программирование микроконтроллеров*Производство и разработка электроники*Хранение данных*Хранилища данных*C*

Туториал

Дана функция чтения и записи EEPROM dword.

Запись и стирание возможно только по выровненному адресу и пословно.

Надо поверх EEPROM API сделать функцию чтения, записи и стирания для произвольных массивов байт, по произвольному адресу (NVRAM).

Простыми словами надо состыковать Dword API с Byte API.

В этом тексте я представил простой наивный алгоритм решения данной задачи.

Virron 15 апр в 13:16

Погружение в ClickHouse: делаем первые и успешные шаги

Простой

6 мин

8.4K

Big Data*Хранение данных*Data Engineering*SQL*Хранилища данных*

Из песочницы

Привет! Меня зовут Андрей Дорожкин, и я руковожу командой администрации баз данных в Hybrid. В этом материале я поделюсь опытом работы с ClickHouse — колоночной БД, разработанной специально для аналитических запросов, которая позволяет получать результаты в разы быстрее традиционных решений. Также я подсвечу, как устроен этот продукт, чем он отличается от реляционных баз данных, и в каких сценариях его использование может дать бизнесу реальное преимущество.

Пара слов о компании Hybrid. Мы — независимая AdTech-экосистема с собственным стеком технологий и решений для любых рекламных целей. Развиваем собственные технологии благодаря in-house отделу разработки, который каждый день работает над их улучшением. ClickHouse — инструмент, который мы выбираем для хранения данных за высокую скорость обработки запросов, эффективное сжатие данных и масштабируемость.

MaxRokatansky 15 апр в 10:12

DWH: История поиска альтернативы PostgreSQL и Snowflake. Часть 2

Средний

10 мин

1.6K

Блог компании OTUSХранение данных*Хранилища данных*SQL*

Перевод

Выбор облачного хранилища данных — задача не из простых: десятки решений, каждая со своими плюсами и подводными камнями. В этой статье — результаты масштабного практического исследования, в ходе которого команда Agritask сравнила производительность, масштабируемость, стоимость и совместимость SQL ведущих платформ: от ClickHouse и BigQuery до Druid и Firebolt. Без маркетинговых обещаний — только реальные тесты, живые выводы и нюансы, которые неочевидны до момента внедрения.

ideavi 13 апр в 08:49

Low-code без границ: 32 млрд квартетов и терабайты данных в конструкторе приложений

Простой

19 мин

8.3K

Хранение данных*Программирование*SQL*Анализ и проектирование систем*IT-стандарты*

Мнение

Бум No-code начался в 2022 году, и сейчас многие компании стараются так или иначе внедрить функционал «low-code» в свои продукты. У участников IT-индустрии пока нет согласия о границах применимости технологий «без кода», хотя адепты этих технологий обещают, что они позволят создавать практически любые приложения.

В этой заметке мы рассмотрим один из основных аспектов создания приложений – его масштабируемость в средней и дальней перспективе. Для этого сам продукт под капотом должен быть построен на чем-то более мощном, чем MS Excel, Airtable, Notion и Make, и такие продукты уже есть на рынке.

Фатальные проблемы масштабируемости проявляются с ростом объемов данных и количества пользователей, которые с ними работают – с этого мы и начнём.

Читать про 32 млрд квартетов

+23

PaaLadin 11 апр в 20:53

Конфиденциальность мертва: Яндекс и ВК обучают ИИ на ваших личных данных?

Простой

5 мин

20K

Big Data*Информационная безопасность*Хранение данных*Машинное обучение*Социальные сети и сообщества

Кейс

Если бы у Кевина Митника была Алиса PRO, то ему бы не пришлось рыться в мусорных баках ради доступа к персональным данным. Протестировав Yandex GPT я узнал, что голосовой ассистент от Яндекс не только раздаёт всем мой номер телефона по первому требованию, но и знает список несовершеннолетних в моей семье, несмотря на «закрытый» профиль ВКонтакте где он был опубликован. А также где‑то хранит всю эту информацию без моего разрешения, но при допросе — уходит в несознанку...

Нырнуть в мусорку от Яндекса...

+119

199

MaxRokatansky 11 апр в 19:39

DWH: История поиска альтернативы PostgreSQL и Snowflake. Часть 1

Средний

13 мин

3.5K

Блог компании OTUSХранилища данных*Хранение данных*SQL*Big Data*

Перевод

Выбор облачного хранилища данных — задача не из тривиальных, особенно когда речь идёт о миллиардах полуструктурированных записей, геоаналитике и требованиях к отклику в доли секунды. В Agritask мы провели масштабное исследование: протестировали популярные DWH-платформы на реальных кейсах, сравнили производительность, параллелизм и затраты. В первой части делимся подходом к оценке, техническими требованиями и тем, почему PostgreSQL и Snowflake перестали справляться с нашими задачами.

blacksan 11 апр в 17:41

ОС против Kafka: битва за map-области: история одного неочевидного лимита

Средний

5 мин

2.5K

Java*Высокая производительность*Apache*IT-инфраструктура*Хранение данных*

Туториал

Добрый день! Меня зовут Богдан, я тимлид в одном из отечественных финтехов. Сегодня я хочу поделиться нашей историей: как нам удалось, ненарочно, зашедулить падение всех нод одного из наших кластеров Kafka.

В один из холодных февральских дней пришло сообщение от мониторинга с виртуальных машин кластера Kafka: «Свободное дисковое пространство достигло значения < 15%». Было решено исследовать, нужно ли добавлять дискового пространства или же можно потюнить настройки ретеншена данных.

Тут стоит немного вспомнить теорию. Как известно, в Kafka сообщения распределяются по партициям, а каждая партиция на брокере представлена набором сегментов. Число сегментов у партиций может быть разным — оно варьируется в зависимости от интенсивности записи и настроек размера сегмента.

Сегмент (если упростить) — это лог-файл, в который просто пишутся данные в конец. По достижении временного предела либо его размера он ротируется: создается новый сегмент, и запись идет уже в него.

Держа вышесказанное в голове, мы отправились смотреть настройки хранения сегментов в нашем кластере Kafka..

skovalev 11 апр в 13:31

Что вендоры выпустили в марте? Новинки от NVIDIA, Supermicro и не только

8 мин

3.2K

Блог компании SelectelВидеокартыКомпьютерное железоПроцессорыХранение данных*

Вопреки весеннему обострению, вендоры в марте оказались более спокойными и не выпускали прорывных новинок. Хотя среди них все же есть «железки», за развитием которых стоит наблюдать. Среди интересных новинок — и новый серверный ускоритель от NVIDIA, и решения, отличные от классических GPU.

Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В этом дайджесте собрал самые стоящие «железки», которые выпустили вендоры в марте. Подробности под катом!

Читать дальше →

+37

Zveridze 11 апр в 13:25

Это путь воина: как я выучил Python и Go с помощью Цеттелькастена и кому точно не рекомендую метод

Простой

9 мин

42K

Блог компании YADROGo*Python*Управление проектами*Хранение данных*

Мнение

Привет, Хабр! Меня зовут Дмитрий, я работаю в YADRO. Я прошел большой путь в самостоятельном изучении языков программирования: от SQL до Go. Сначала я вообще не документировал процесс обучения, затем стал вести заметки по «академическому» принципу — писал конспекты, как в университете. Пока не открыл древовидную систему хранения данных, которая лежит в основе метода Цеттелькастен.

В этой статье расскажу, как порядок в заметках помогает лучше усваивать материал, кому подойдет Цеттелькастен или подобные методы и что лучше — простые конспекты или структурированные заметки.

+44

mClouds_editor 10 апр в 11:57

NVMe для HDD: как новая технология решает проблемы хранения данных ИИ

Простой

8 мин

Блог компании mClouds.ruIT-инфраструктура*Хранение данных*Читальный залКомпьютерное железо

Обзор

Системы искусственного интеллекта сталкиваются с серьезной проблемой: как хранить и обрабатывать огромные объемы данных, необходимые для обучения и работы моделей. Традиционные решения уже не справляются с требованиями скорости, масштабируемости и экономичности.

Решением могут стать жесткие диски с интерфейсом NVMe. Они сочетают в себе экономичность HDD с производительностью NVMe, устраняя узкие места в системах хранения данных для ИИ.

Seagate впервые представила прототип таких накопителей в 2021 году на саммите Open Compute Project, а в марте 2025 года на конференции GTC компания продемонстрировала уже полноценное решение, интегрирующее NVMe HDD с современной платформой Mozaic 3+ и процессорами обработки данных NVIDIA BlueField-3.

Разбираемся, как NVMe HDD могут изменить подход к хранению данных для ИИ и стать ключевым элементом будущих инфраструктур.

DimDimDimDimDim 10 апр в 11:07

Рассказываем об апдейтах за март: месяц бесплатного S3, настройка IOPS и не только

5 мин

3.2K

Блог компании SelectelIT-инфраструктура*Kubernetes*Облачные вычисления*Хранение данных*

Привет! Я — Дима, технический писатель в Selectel. Под катом рассказываю, как подключать сетевые диски к нескольким серверам, о новых конфигурациях в DBaaS, а также улучшениях в Kubernetes. В конце — приглашения на апрельские мероприятия.

Читать дальше →

+37

Webest 10 апр в 10:16

Как защитить интернет-магазин от перегрузок: RPS, масштабирование и отказоустойчивость

Простой

9 мин

835

Nginx*Серверная оптимизация*Серверное администрирование*Хранение данных*IT-инфраструктура*

Обзор

Перегрузка интернет-магазина – головная боль владельца бизнеса. Сайт тормозит, корзина зависает, клиенты не могут оформить заказ. Почему это происходит? Как предотвратить коллапс системы в разгар распродаж?

В этой статье расскажем, как повысить RPS и обеспечить отказоустойчивость. Поделимся планом действий и разберем кейс из нашей практики.

-1

yadro_team 9 апр в 17:20

Более 4 000 ГБ за 11 минут: тестируем три сценария резервного копирования с Кибер Бэкап и TATLIN.BACKUP

Средний

14 мин

Блог компании YADROБлог компании КиберпротектРезервное копирование*Хранение данных*Хранилища данных*

В формуле идеального решения для резервного копирования данных enterprise-класса много переменных. Одна из ключевых — производительность решения, включая скорость копирования, нагрузку на сеть и потребление вычислительных ресурсов хранилища и источника данных.

Инженеры компаний YADRO и Киберпротект протестировали совместную работу системы резервного копирования Кибер Бэкап и системы хранения данных TATLIN.BACKUP в трех сценариях сохранения резервных копий виртуальных машин: с inline-дедупликацией, по протоколу NFS и агентом Tboost на узле хранения. Поделимся результатами тестирования совместимого решения, а заодно предметно поговорим об организации правильной архитектуры с учетом особенностей конкретной инфраструктуры.

+13

2 3 ...

121 122

Хранение данных *

(Почти) идеальный мини-NAS для мини-стойки

Новости

Делиться знаниями — значит расти. 6 шагов к построению базы знаний на основе DWH

Как сделать компьютерную память из ржавых гвоздей и нейросети — из медных проволок?

Что такое Ansible и как применяется в DWH-проектах? Сравнение Ansible с Puppet, Chef, SaltStack

Истории

Асинхронно копируем объекты между регионами S3 с помощью Python

7 опорных функций, которые должны быть в вашей системе Data Governance

В Европе снова заговорили об отказе от американских платформ и суверенном облаке — анализ ситуации

NVRAM из EEPROM

Погружение в ClickHouse: делаем первые и успешные шаги

DWH: История поиска альтернативы PostgreSQL и Snowflake. Часть 2

Low-code без границ: 32 млрд квартетов и терабайты данных в конструкторе приложений

Конфиденциальность мертва: Яндекс и ВК обучают ИИ на ваших личных данных?

DWH: История поиска альтернативы PostgreSQL и Snowflake. Часть 1

Ближайшие события

ОС против Kafka: битва за map-области: история одного неочевидного лимита

Что вендоры выпустили в марте? Новинки от NVIDIA, Supermicro и не только

Это путь воина: как я выучил Python и Go с помощью Цеттелькастена и кому точно не рекомендую метод

NVMe для HDD: как новая технология решает проблемы хранения данных ИИ

Рассказываем об апдейтах за март: месяц бесплатного S3, настройка IOPS и не только

Как защитить интернет-магазин от перегрузок: RPS, масштабирование и отказоустойчивость

Более 4 000 ГБ за 11 минут: тестируем три сценария резервного копирования с Кибер Бэкап и TATLIN.BACKUP