Czytanie pakietu DNS w Pythonie

Nov 29 2020

To pytanie zostało zadane wcześniej, ale nigdy nie zostało w pełni rozwiązane i pochodzi z 2013 roku. Używam gniazd Python do obserwacji pakietów DNS, wyglądają tak:

b'\x01\x01\x00\x00\x01\x00\x00\x00\x00\x00\x00\x03www\x10googletagmanager\x03com\x00\x00\x01\x00\x01'

Po zbadaniu podstaw pakietów DNS stwierdziłem, że mają one następującą strukturę:

QR | OpCode | AA | TC | RD | RA | Z | AD | CD | RCODE

Następnie zdekodowałem pakiet do ASCII:

>> str = b'\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x03www\x10googletagmanager\x03com\x00\x00\x01\x00\x01'
>> print(str.decode("ascii"))
wwwgoogletagmanagercom

Zwraca tylko pojedynczy ciąg z nazwą adresu, a nie inne informacje, jak określono powyżej. Gdzie jest reszta danych, jak QR i OpCode? Czy dekoduję to nieprawidłowo?

Żeby było jasne, nie chcę korzystać z zewnętrznej biblioteki, a moim celem jest zrozumienie struktury pakietów DNS i sposobu ich dekodowania; Znam biblioteki takie jak dnslibi scapy.

Odpowiedzi

2 frankr6591 Nov 29 2020 at 21:50

Nie jestem ekspertem od gniazd. Z odniesienia - nagłówek DNS składa się z bitów, a nie bajtów ... więc musisz go przeanalizować jako bity. Użyj bajtów i bitów maski. Zobacz przykład poniżej. Nie masz pewności, jaka jest zawartość nagłówka hdr [12:]?

Oto przykładowy kod oparty na powyższej specyfikacji:

def DNStoDict(hdr):
    '''
    Parse QNAME by using length (byte) +data sequence -- final length=0 signifies end of QNAME
    Refer to https://stackoverflow.com/questions/34841206/why-is-the-content-of-qname-field-not-the-original-domain-in-a-dns-message

    1) DNS knows nothing of URLs. DNS is older than the concept of a URL.

    2) Because that's how DNS's wire format works. What you see is the 
       domain name www.mydomain.com, encoded in the DNS binary format. 
       Length+data is a very common way of storing strings in general.
    '''

        # Build DNS dictionary of values... include QNAME
    l = len(hdr)
    argSize = hdr[10]*256+hdr[11]
    dnsDict = dict(ID     = hdr[0]*256+hdr[1],
                   QR     = bool(hdr[2] & int('10000000', 2)),
                   Opcode =     (hdr[2] & int('01111000', 2))>>3,
                   AA     = bool(hdr[2] & int('00000100', 2)),
                   TC     = bool(hdr[2] & int('00000010', 2)),
                   RD     = bool(hdr[2] & int('00000001', 2)),
                   RA     = bool(hdr[3] & int('10000000', 2)),
                   Z      = bool(hdr[3] & int('01000000', 2)),
                   AD     = bool(hdr[3] & int('00100000', 2)),
                   CD     = bool(hdr[3] & int('00010000', 2)),
                   RCode  = bool(hdr[3] & int('00001111', 2)),
                   QDCOUNT = hdr[4]*256+hdr[5],
                   ANCOUNT = hdr[6]*256+hdr[7],
                   NSCOUNT = hdr[8]*256+hdr[9],
                   ARCOUNT = argSize,
                   QTYPE   = hdr[l-4]*256+hdr[l-3],
                   QCLASS   = hdr[l-2]*256+hdr[l-2])

    # Parse QNAME
    n = 12
    mx = len(hdr)
    qname = ''

    while n < mx:
        try:
            qname += hdr[n:n+argSize].decode() + '.'

            n += argSize
            argSize = int(hdr[n])
            n += 1
            if argSize == 0 : 
                break
        except Exception as err:
            print("Parse Error", err, n, qname)
            break
    dnsDict['QNAME'] = qname[:-1]
    return dnsDict

# Sample DNS Packet Data 
hdr = b'\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x03www\x10googletagmanager\x03com\x00\x00\x01\x00\x01'


# Parse out the QNAME
dnsDict = DNStoDict(hdr)


print("\n DNS PACKET dictionary")
print(dnsDict)

WYNIK:

Słownik DNS PACKET {'ID': 257, 'QR': False, 'Opcode': 0, 'AA': False, 'TC': False, 'RD': False, 'RA': False, 'Z': Fałsz, „AD”: False, „CD”: False, „RCode”: False, „QDCOUNT”: 0, „ANCOUNT”: 0, „NSCOUNT”: 0, „ARCOUNT”: 3, „QTYPE”: 1, „QCLASS”: 0, „QNAME”: „www.googletagmanager.com”}

Manipulacja bitami Pyhon

Odnosić się do

  1. https://wiki.python.org/moin/BitManipulation
  2. http://www.java2s.com/Tutorials/Python/Data_Types/How_to_create_integer_in_Python_octal_binary_hexadecimal_and_long_integer.htm

Bajt ( b'xxxx') reprezentuje 4 bajty. Każdy bajt składa się z 8 bitów

0000 0000 - 0 0000 0001 - 1 0000 0010 - 2 0000 0100 - 4 0000 1000 - 8 0001 0000 - 16 0010 0000 - 32 0100 0000 - 64 1000 0000 - 128 1111 1111 - 255 (128 + 64 + 32 + 16 + 8 + 4 + 2 + 1)

W Pythonie format int ('00000111', 2) konwertuje tablicę łańcuchów ['0' / '1'] za pomocą modulo 2 (bity). Zwraca wartość 7 modulo 10.

Odniesienie do nagłówka DNS: https://www2.cs.duke.edu/courses/fall16/compsci356/DNS/DNS-primer.pdf http://www.networksorcery.com/enp/protocol/dns.htm