El DNA de las células almacena la información genética de un organismo. Los genes contienen información para la síntesis de moléculas de RNA que son complementarias a una de las hebras del DNA. Los principales tipos de RNA en las células son el RNA ribosomal, el RNA de transferencia y el RNA mensajero. Cada molécula de RNA mensajero contiene la información para la secuencia de aminoácidos de una proteína, mientras que el RNA ribosomal y el RNA de transferencia están involucrados en la traducción de la información genética a proteínas.

La información para las moléculas de RNA y las proteínas en una célula se encuentra codificada en el DNA del organismo. La secuencia de aminoácidos de una proteína está codificada en el RNA mensajero mediante unidades de tres bases llamadas codones. La combinación de cuatro letras en el DNA (A, T, C y G) o en el RNA mensajero (A, U, C y G) en grupos de tres puede generar 64 codones. Estos codones y su significado conforman el código genético. Dado que hay alrededor de 20 aminoácidos diferentes, varios codones pueden codificar para un mismo aminoácido, lo que se conoce como "degeneración" del código genético. Algunos codones también funcionan como señales de terminación en la síntesis de proteínas.

El código genético es común a todos los organismos, ya que la secuencia de aminoácidos de las proteínas de bacterias y humanos se codifica en el DNA mediante el mismo código. Sin embargo, debido a la degeneración del código, un mismo aminoácido puede tener preferentemente diferentes codones en bacterias y humanos. Aunque el código genético es generalmente el mismo en todos los organismos, existen excepciones, como el codón de terminación UGA en el DNA mitocondrial de levaduras y humanos, que codifica para el aminoácido triptófano.

Además del código genético que decodifica la información de los mRNA para sintetizar proteínas, el DNA contiene información para regular la expresión de los genes. Por ejemplo, el DNA contiene información sobre los sitios de inicio y finalización de la copia del RNA por la enzima RNA-polimerasa, así como información que determina cuándo y cuántas copias se deben sintetizar. Estas secuencias de bases que contienen información reguladora son diferentes en diferentes organismos, lo que significa que no hay un código universal para las secuencias reguladoras.