Některé rysy organizace lidského genomu
Pouze 1,1 až 1,4% celého sekvenovaného genomu jsou sekvence kódující proteiny.
Jednou z nejdůležitějších částí programu Lidského genomu je detekce genů v sekvenovaných sekvencích genomu. Pozice mnoha genů je určena shodou sekvencí mRNA s genomovým sekvenováním, u jiných genů se lokalizace zřizuje pomocí speciálních počítačových programů.
Hledání v sekvenčních genů jsou také pomocí speciálního, tzv ortologní přístup pro identifikaci nukleotidových sekvencí podobné sekvence genů u jiných druhů.To se provádí pomocí počítačového programu BLAST pro sekvence genomu nebo mRNA.Dalším způsobem hledání genů je identifikace paralogů( členů rodiny, které vznikly v důsledku genové duplikace).Byly také použity další metody hledání genů v lidské sekvenované DNA.
Společenství Project „Lidský genom“ poskytuje odhad genů kódujících proteiny v 31,000, odkryté na základě výsledků sekvencování alespoň 20,000 genů.Mezi nimi bylo identifikováno 740 genů pro RNA, které nekódují proteiny, ale pravděpodobně budou detekovány více takových genů.V kvasinkách, jsou geny kódující 6000, v Drosophila - 13 000 rostlin - 26 000. Proto je otázka, čímž se zajistí, složitost lidského organizace v porovnání s ostatními, jednodušeji organizované organismy, zůstává otevřená.
Hustota genů v lidském genomu je výrazně nižší než u jiných druhů.Bohužel metody počítačové predikce genů výsledky sekvence jsou stále velmi nepřesné.
Pouze 94 z 1278 rodin proteinů v lidském genomu je charakteristické pouze pro obratlovce. Hlavní rozdíly mezi člověkem a kvasinek nebo běhu je složitost organizace lidských proteinů, která se projevuje ve velkém počtu proteinových domén, jakož i nových kombinací domén. Některé z genů jsou získány lidmi, zřejmě přímo z bakterií v důsledku tzv. Horizontálního genového přenosu. Je zřejmé, že bakteriální genom by mohl sloužit jako přímý dárce genů pro obratlovce. V vertebrates
pozorováno zlepšení ve vzhledu dvou druhů genů specifické pro obratlovce, jako je neuronální geny srážení geny a geny získané imunitní odpovědi, na jedné straně, a genů, které poskytují zvýšení přesnosti řízení intracelulárních procesů( geny pro intra- a intercelulární signálů, programovaná smrt buněk a kontrola transkripce genu) na straně druhé.
Výsledky sekvencování lidského genomu stimulovány detekci jednonukleotidových polymorfismů( SNP), které mají být použity pro mapování genů predispozice k multifaktoriální onemocnění časté.
Detekce genů dědičných onemocnění byla velmi usnadněna použitím kontinuálního návrhu, protože je přístupná všem vědcům díky internetu. Je možné identifikovat kandidátní geny podle jejich polohy v genomu pomocí počítačových programů přímo ze sekvenční databáze, následované screeningem pro mutaci doplněnou informacemi o struktuře genu. Bylo nalezeno více než 30 genů dědičných onemocnění.
Předpokládá se, že sekvence bude dokončena během relativně krátké doby. Zvláštní pozornost bude věnována nejen tvorbě sofistikovanějších počítačových identifikačních programů pro geny, ale i jejich regulační oblasti. Zdá se, že úspěch posledních dvou směrů výzkumu bude záviset na úspěchu sekvence genomů jiných vyšších zvířat. Na základě sekvence lidského genomu bude vytvořen katalog genetických variací u lidí.