msgbartop
Just another Blog
msgbarbottom

28 Jul 11 WordPress Umzug und Domainwechsel – Inhalte und Posts ändern

Der Umzug eines Worpress Blogs ist recht einfach: Dateien kopieren, Datenbank sichern und beim Provider dank PHPMyAdmin einspielen und schließlich die wp-config.php und die Tabelle xxx_options ändern. Was aber machen wenn sich die Domain geändert hat und dutzende Posts/Artikel warten von Hand geändert zu werden: Schaut Euch einfach mal dieses Plugin an: Search Regex Plugin . Ein sehr mächtiges Tool !! Ihr könnt Eure Posts durchsuchen und automatisch ändern. Aber bitte eine Sicherung der Datenbank vorab nicht vergessen. Sollte der Upload von Bilder nicht funktionieren, schaut Euch unter Mediathek auch die Einstellungen an!

24 Jun 11 Mongo DB und Partitionierung, Sharding und Failover

Boxed ICE hat zum Thema Mongo DB und Partitionierung, Sharding und Failover ein paar nette Sachen zusammen getragen. Viel Spass beim lesen und sehen:

 

21 Jun 11 Installationsanleitung HBASE

Dominic Williams hat eine recht gute und verständliche Anleitung für die Instellation von ‘HBase in “pseudo distributed” mode’ bereitgestellt: Quick install HBase in “pseudo distributed” mode and connect from Java. Viel Spass beim Installieren!

21 Jun 11 Einfaches Einstpielen einer MDF Datei im MSSQL Server

SQL Query Analyser öffnen:

sp_attach_db ‘[Datenbankname]‘ ,’[Pfad zur .mdf Datei]‘

Ist die Datanbank nicht vorhanden, wird sie erstellt.

Done

13 Jun 11 Domainsauswertung

Eine seht Interessante Möglichkeit der Domainsauswertung bietet push2check. Schaut mal rein!

03 Jun 11 MapReduce vs Hadoop (++)

Auch mit geringen Computerkenntnissen kann man mit Hadoop auf einfache Weise viele Milliarden Datensätze parallel auf mehreren Servern durchsuchen.
Hadoop ist ein freies, in Java geschriebenes Framework für skalierbare, verteilt arbeitende Software. Es basiert auf dem MapReduce-Algorithmus, sowie auf Vorschlägen des Google-Dateisystems und ermöglicht es, ebenso intensive Rechenprozesse mit großen Datenmengen durchzuführen. HDFS (Hadoop Distributed File System) ist ein hochverfügbares, leistungsfähiges Dateisystem zur Speicherung sehr großer Datenmengen. Dateien werden auf mehrere Datenblöcke verteilt. Zur Steigerung der Zuverlässigkeit und Geschwindigkeit legt HDFS mehrfach Kopien von einzelnen Datenblöcken an. Ein Masterknoten bearbeitet eingehende Datenanfragen, organisiert die Ablage von Dateien und speichert anfallende Metadaten.

Dazu hat Google MapReduce entwickelt. Das als Open-Source-Produkt angebotene Hadoop-Programm basiert auf der Idee von MapReduce.
Hadoop beinhaltet eine MapReduce Lizenz (patentrechtlich von Google geschützt).

MapReduce hat (erstmal) nichts mit SQL zu tun!
Dazu wäre HBase zu erwähnen: HBase ist eine skalierbare, einfache Datenbank zur Verwaltung sehr großer Datenmengen innerhalb eines Hadoop-Clusters. Die HBase-Datenbank basiert auf einer freien Implementierung von Google BigTable. Diese Datenstruktur ist für Daten geeignet, die selten verändert werden, dafür aber sehr häufig ergänzt werden. Mit HBase lassen sich Milliarden von Zeilen verteilt und performant verwalten

SQL-Spezialisten betrachten MapReduce als großen Rückschritt (Quelle Jens Dittrich, Professor für Informationssysteme der Universität des Saarlandes) da es Erfahrungen aus der Datenbankforschung nicht berücksichtigt. Auch wenn die Datenmenge, die mit MapReduce durchsucht werden kann, riesig sind, scheint es eher ineffizient zu sein im Vergleich mit RDBS. Vorteile bestehen darin, das man keine Datenbanksprachen oder Modelle lernen muss, das die Administration von Hadoop/MapReduce sehr einfach ist und Hadoop kostenlos verfügbar ist. Allerdings gibt es auf bei Hadoop Leistungsgrenzen. Hadoop ist im Vergleich zu modernen Datenbanksystemen zu langsam. Die Universität des Saarlandes hat dazu eine Erweiterung von Hadoop entwickelt: Hadoop ++ .

Hadoop++ ähnelt in seinem Prozessablauf einem trojanisches Pferd. Hadoop bleibt dabei unverändert, aber an geiegneten Stellen wird zusätzlichen Code eingeschleust, der für eine möglichst effizientere Ausführung sorgt. Alle Änderungen erfolgen durch Nutzerfunktionen (UDF/user-defined functions). Das neue Programm folgt damit einem ähnlichen Ansatz wie ein Trojaner. Hadoop ++ soll bis zu 18 mal schneller sein als Hadoop.

Eine wirklich gutes Beispiel für Hadoop’s Map Reduce Architektur ist CloudBase (http://cloudbase.sourceforge.net)
Diese Software erlaubt es Millarden an Terabytes sogar mit ANSI SQL abzufragen. Ein JDBC Treiber steht zur Verfügung und kann dadurch Beispielsweise mit BI Tools und Reporting Frameworks genutzt werden. ANSI SQL Ausdrücke werden in MapReduce Prozesse umgewandelt und können einfache Text-Dateien dursuchen.

Quelle:
Universität des Saarlandes, Jens Dittrich, Professor für Informationssysteme

http://de.wikipedia.org/wiki/Hadoop

http://sourceforge.net/projects/cloudbase/

03 Jun 11 MapReduce wichtigste Programmierframework der Zukunft

Ich kann mich noch gut erinnern, wie ich 2004/2005 mit einem MSSQL Server (sogar einer Enterprice Edition) eine Sitetracker ähnlich Google Analytics bauen sollte. Wir haben jeden Tag Millionen an Datensätze gespeichert und merkten schnell: Das wird nichts ;D …und schon garnicht mit nur einem Server

Zwischenzeiltlich hat sich viel getan. Einen Lesenswerten Artikel von Ruwen Schwerin in der PC World über den Punkt Datenverfügbarkeit und Speicherung mit NoSQL und MapReduce :

  1. Die 10 wichtigsten Technologien der Zukunft
  2. Plätze 10 und 9: Whitelisting und Cross-Platform-Developm…
  3. Plätze 8 und 7: Hardware-Stromsparfunktionen und Manycore…
  4. Plätze 6 und 5: Solid State Drives und NoSQL-Datenbanken
  5. Plätze 4 und 3: I/O-Virtualisierung und Datendeduplizierung
  6. Plätze 2 und 1: Desktop-Virtualisierung und MapReduce