La cantidad total de DNA en las células, conocida como valor C, varía entre diferentes organismos. En procariontes como bacterias y arqueas, los genomas tienen un rango de tamaño aproximado de 20 veces, desde 6x10^5 pares de bases en algunos organismos parásitos intracelulares hasta más de 10^7 pares de bases en cianobacterias. En cambio, en eucariontes, los valores C son generalmente mayores, aunque existen excepciones. Por ejemplo, la levadura tiene un tamaño de genoma similar al de las cianobacterias. La variación en los valores C en eucariontes es mucho mayor que en las bacterias, llegando a diferencias de más de 80,000 veces.

La variación en el tamaño del genoma entre los eucariontes no está directamente relacionada con la complejidad del organismo o el número de genes codificados en el genoma. Por ejemplo, algunos protistas tienen mucho más DNA que los mamíferos, y organismos aparentemente similares en complejidad pueden tener diferentes valores C. A esta falta de relación se le conoce como la paradoja del valor C. Sin embargo, cuando se compara el número de genes y la complejidad de los organismos, sí se observa una relación. Los organismos más complejos tienden a tener un mayor número de genes que los más simples.

La paradoja del valor C indica que los genomas contienen no solo genes, sino también otras secuencias que codifican para moléculas de RNA y proteínas presentes en la célula. Esto implica que existen secuencias adicionales en el DNA cuya función aún no se comprende completamente.

Los genomas contienen secuencias de DNA que varían en tamaño y se repiten cientos o miles de veces en el genoma. Estas secuencias pueden estar agrupadas o dispersas por todo el genoma, y su secuencia y número de copias varían entre organismos. En el genoma humano, por ejemplo, la secuencia repetida llamada Alu está presente en más de 300,000 copias y constituye aproximadamente el 35% al 45% del genoma. Aunque se han propuesto hipótesis y mecanismos moleculares para explicar su origen y amplificación, la función de muchas de estas secuencias repetidas aún no se comprende bien.

En los seres humanos, hay alrededor de 10 clases diferentes de secuencias repetidas pequeñas que representan aproximadamente el 1% del DNA. Las copias de una clase de estas secuencias son similares en cuanto a su secuencia de bases, pero su número varía entre individuos. Esta característica permite la identificación individual similar a las huellas digitales, especialmente utilizando la secuencia repetida conocida como minisatélite. Esta secuencia se repite de 20 a 50 veces y se encuentra en regiones relativamente pequeñas del genoma. Cada individuo tiene un número y distribución característicos de estas secuencias, lo que permite diferenciar incluso a hermanos. Este método se utiliza en medicina legal para la identificación de criminales, violadores o personas cuya identidad es desconocida, y solo requiere una pequeña cantidad de DNA, como una gota de sangre o un poco de semen.