SAP BODS - Tuning-Techniken

Die Leistung eines ETL-Jobs hängt von dem System ab, auf dem Sie die Data Services-Software verwenden, der Anzahl der Verschiebungen usw.

Es gibt verschiedene andere Faktoren, die zur Leistung einer ETL-Aufgabe beitragen. Sie sind -

  • Source Data Base - Die Quellendatenbank sollte so eingestellt sein, dass sie das ausführt SelectAussagen schnell. Dies kann erreicht werden, indem die Größe der Datenbank-E / A erhöht wird, der gemeinsam genutzte Puffer vergrößert wird, um mehr Daten zwischenzuspeichern, und keine Parallelität für kleine Tabellen usw. zulässig ist.

  • Source Operating System- Das Quellbetriebssystem sollte so konfiguriert sein, dass die Daten schnell von den Festplatten gelesen werden können. Stellen Sie das Read Ahead-Protokoll auf 64 KB ein.

  • Target Database - Die Zieldatenbank muss für die Ausführung konfiguriert sein INSERT und UPDATEschnell. Dies kann erfolgen durch -

    • Deaktivieren der Archivprotokollierung.
    • Deaktivieren der Redo-Protokollierung für alle Tabellen.
    • Maximieren der Größe des gemeinsam genutzten Puffers.
  • Target Operating System- Das Zielbetriebssystem muss konfiguriert sein, damit die Daten schnell auf die Festplatten geschrieben werden können. Sie können asynchrone E / A aktivieren, um die Eingabe- / Ausgabeoperationen so schnell wie möglich zu gestalten.

  • Network - Die Netzwerkbandbreite sollte ausreichen, um die Daten von der Quelle zum Zielsystem zu übertragen.

  • BODS Repository Database - Um die Leistung von BODS-Jobs zu verbessern, kann Folgendes ausgeführt werden:

    • Monitor Sample Rate - Wenn Sie eine große Datenmenge in einem ETL-Job verarbeiten, überwachen Sie die Abtastrate auf einen höheren Wert, um die Anzahl der E / A-Aufrufe der Protokolldatei zu verringern und so die Leistung zu verbessern.

    • Sie können die Data Services-Protokolle auch vom Virenscan ausschließen, wenn der Virenscan auf dem Jobserver konfiguriert ist, da dies zu Leistungseinbußen führen kann

  • Job Server OS - In Data Services initiiert ein Datenfluss in einem Job einen ‘al_engine’Prozess, der vier Threads initiiert. Betrachten Sie für maximale Leistung ein Design, das eines ausführt‘al_engine’Prozess pro CPU zu einem Zeitpunkt. Das Job Server-Betriebssystem sollte so optimiert sein, dass alle Threads auf alle verfügbaren CPUs verteilt sind.