beige.party is one of the many independent Mastodon servers you can use to participate in the fediverse.
A home to friendly weirdos. The Grey Gardens of the Fediverse (but beige). Occasionally graphically cacographic. Definitely probably not a cult (though you'll never be 100% sure). Beige-bless 🙏

Server stats:

447
active users

#bigdata

12 posts12 participants0 posts today

Irish regulator investigates X over use of EU personal data to train Grok AI

Ireland's data regulator on Friday said it had opened an investigation into social media platform X over the use of personal data collected from European Union users to train its AI system Grok

#Ireland #EU #Europe #GDPR #socialmedia #twitter #x #grok #artificialintelligence #AI #data #bigdata #technology #tech

finance.yahoo.com/news/irish-r

Yahoo Finance · Irish regulator investigates X over use of EU personal data to train Grok AIBy Reuters

Погружение в ClickHouse: делаем первые и успешные шаги

Привет! Меня зовут Андрей Дорожкин, и я руковожу командой администрации баз данных в Hybrid. В этом материале я поделюсь опытом работы с ClickHouse — колоночной БД, разработанной специально для аналитических запросов, которая позволяет получать результаты в разы быстрее традиционных решений. Также я подсвечу, как устроен этот продукт, чем он отличается от реляционных баз данных, и в каких сценариях его использование может дать бизнесу реальное преимущество. Пара слов о компании Hybrid. Мы — независимая AdTech-экосистема с собственным стеком технологий и решений для любых рекламных целей. Развиваем собственные технологии благодаря in-house отделу разработки, который каждый день работает над их улучшением. ClickHouse — инструмент, который мы выбираем для хранения данных за высокую скорость обработки запросов, эффективное сжатие данных и масштабируемость.

habr.com/ru/articles/901018/

ХабрПогружение в ClickHouse: делаем первые и успешные шагиПривет! Меня зовут Андрей Дорожкин, и я руковожу командой администрации баз данных в Hybrid. В этом материале я поделюсь опытом работы с ClickHouse — колоночной БД, разработанной специально для...

From the Data Rescue Project: the Data Rescue Tracker. “The Data Rescue Tracker is a collaborative tool built to catalog existing public data rescue efforts so that we can coordinate better across initiatives. At this stage, you can use the tool to help reduce duplication of rescue efforts. The Data Rescue Tracker aims to provide a consolidated overview of who is backing up which dataset from […]

https://rbfirehose.com/2025/04/13/the-data-rescue-tracker/

ResearchBuzz: Firehose | Individual posts from ResearchBuzz · The Data Rescue Tracker | ResearchBuzz: Firehose
More from ResearchBuzz: Firehose

I’ve been working on a pretty gnarly data a warehouse reporting problem for the past few days. It’s up, leveling my ability to do this kind of work. The tooling has always been so limited and I am beginning to understand it is me who is limited in the understanding of the tooling ecosystem.

There may or may not be a wonderful overlap of programming and data warehousing but it’s clear that me not being aware of it doesn’t mean it doesn’t exist.

Axios: NOAA research websites slated to go dark get a reprieve.”NOAA has averted the early cancellation of an Amazon Web Services contract that would have caused a slew of agency websites to go dark beginning at midnight, the agency said Friday. Why it matters: The outages mainly would have affected NOAA’s research division, and would have made numerous websites and data sets inaccessible to […]

https://rbfirehose.com/2025/04/06/axios-noaa-research-websites-slated-to-go-dark-get-a-reprieve/

Schon krass: #LG zwingt mich als Nutzer eines seiner Fernsehgeräte zuzustimmen, dass sie mein komplettes Sehverhalten erfassen und weiterverarbeiten. Wenn ich das nicht tue, darf ich auf diesem Gerät noch nicht mal Netflix starten - für das ich 20 Euro monatlich zahle.

Wie komme ich aus der Nummer raus ohne diesen Fernseher zu schrotten? Und gibt es einen Gerätehersteller, der das nicht auf die gleiche Weise macht...?
#smarttv #privacy #tracking #bigdata

Matomo's Cloud has an optional export module, Data Warehouse Export. It works with all of these:
Amazon Redshift, Apache Hive, Azure Synapse Analytics, ClickHouse, Databricks (on Apache Spark), Google BigQuery, Greenplum, PostgreSQL, Snowflake, Teradata, Vertica

And Matomo On Premises allows direct db access (to MySQL or MariaDB) to accomplish the same thing.

matomo.org/subcategory/data-wa