Pero, ¿cuál es la diferencia entre sección y segmento?
Exactamente lo que citó:los segmentos contienen información necesaria en tiempo de ejecución, mientras que las secciones contienen información necesaria durante la vinculación.
¿Un segmento contiene una o más secciones?
Un segmento puede contener 0 o más secciones. Ejemplo:
readelf -l /bin/date
Elf file type is EXEC (Executable file)
Entry point 0x402000
There are 9 program headers, starting at offset 64
Program Headers:
Type Offset VirtAddr PhysAddr
FileSiz MemSiz Flags Align
PHDR 0x0000000000000040 0x0000000000400040 0x0000000000400040
0x00000000000001f8 0x00000000000001f8 R E 8
INTERP 0x0000000000000238 0x0000000000400238 0x0000000000400238
0x000000000000001c 0x000000000000001c R 1
[Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
LOAD 0x0000000000000000 0x0000000000400000 0x0000000000400000
0x000000000000d5ac 0x000000000000d5ac R E 200000
LOAD 0x000000000000de10 0x000000000060de10 0x000000000060de10
0x0000000000000440 0x0000000000000610 RW 200000
DYNAMIC 0x000000000000de38 0x000000000060de38 0x000000000060de38
0x00000000000001a0 0x00000000000001a0 RW 8
NOTE 0x0000000000000254 0x0000000000400254 0x0000000000400254
0x0000000000000044 0x0000000000000044 R 4
GNU_EH_FRAME 0x000000000000c700 0x000000000040c700 0x000000000040c700
0x00000000000002a4 0x00000000000002a4 R 4
GNU_STACK 0x0000000000000000 0x0000000000000000 0x0000000000000000
0x0000000000000000 0x0000000000000000 RW 8
GNU_RELRO 0x000000000000de10 0x000000000060de10 0x000000000060de10
0x00000000000001f0 0x00000000000001f0 R 1
Section to Segment mapping:
Segment Sections...
00
01 .interp
02 .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame
03 .ctors .dtors .jcr .dynamic .got .got.plt .data .bss
04 .dynamic
05 .note.ABI-tag .note.gnu.build-id
06 .eh_frame_hdr
07
08 .ctors .dtors .jcr .dynamic .got
Aquí, PHDR
el segmento contiene 0 secciones, INTERP
el segmento contiene .interp
sección, y el primer LOAD
segmento contiene un montón de secciones.
Lectura adicional con una bonita ilustración.
La sección contiene datos estáticos para el enlazador, datos dinámicos del segmento para el sistema operativo
La cita es correcta, pero para comprender realmente la diferencia, debe intentar comprender los campos del encabezado de la sección y las entradas del encabezado del programa (segmento), y cómo los utiliza el enlazador (secciones) y el sistema operativo (segmento) .
Las informaciones particularmente importantes son (además de las longitudes):
-
sección:decirle al enlazador si una sección es:
- datos sin procesar que se cargarán en la memoria, p.
.data
,.text
, etc. - o metadatos formateados sobre otras secciones, que serán utilizados por el enlazador, pero desaparecerán en el tiempo de ejecución, p.
.symtab
,.srttab
,.rela.text
- datos sin procesar que se cargarán en la memoria, p.
-
segmento:le dice al sistema operativo:
- dónde debe cargarse un segmento en la memoria virtual
- qué permisos tienen los segmentos (lectura, escritura, ejecución). Recuerde que esto puede ser aplicado de manera eficiente por el procesador:¿Cómo funciona la paginación x86?
He escrito un tutorial que cubre eso con más detalle en:http://www.cirosantilli.com/elf-hello-world/
¿Un segmento contiene una o más secciones?
Sí, y es el enlazador el que coloca las secciones en segmentos.
En Binutils, cómo las secciones se colocan en segmentos por ld
está determinado por un archivo de texto llamado guión de enlace . Documentos:https://sourceware.org/binutils/docs/ld/Scripts.html
Puede obtener el predeterminado con ld --verbose
y establece uno personalizado con -T
.
Por ejemplo, mi secuencia de comandos predeterminada del enlazador de Ubuntu 17.04 contiene:
.text :
{
*(.text.unlikely .text.*_unlikely .text.unlikely.*)
*(.text.exit .text.exit.*)
*(.text.startup .text.startup.*)
*(.text.hot .text.hot.*)
*(.text .stub .text.* .gnu.linkonce.t.*)
}
que le dice al enlazador que coloque secciones llamadas .text.unlikely
, .text.*_unlikely
, .text.exit
, etc. en el .text
segmento.
El desarrollo del sistema operativo es un caso en el que los scripts personalizados son útiles, ejemplo mínimo:https://github.com/cirosantilli/x86-bare-metal-examples/blob/d217b180be4220a0b4a453f31275d38e697a99e0/linker.ld
Una vez que se vincula el ejecutable, solo es posible saber qué sección fue a qué segmento si el vinculador almacena el encabezado de sección opcional en el ejecutable:¿Dónde se almacena la "Asignación de sección a segmento" en los archivos ELF?