R04 03 (3)

[ Pobierz całość w formacie PDF ]
.W przypadku trzech zmiennych A, B i C mo�eto wygl�da� nast�puj�co:void (*MyFunctions[8])()={MyFunction0, // A=false, B=false, C=falseMyFunction1, // A=false, B=false, C=trueMyFunction2, // A=false, B=true, C=falseMyFunction3, // A=false, B=true, C=trueMyFunction4, // A=true, B=false, C=falseMyFunction5, // A=true, B=false, C=trueMyFunction6, // A=true, B=true, C=falseMyFunction7 // A=true, B=true, C=true}W naszej przyk�adowej aplikacji wykorzystali�my t� ide� wielokrotnie.Abywybra� kolejne s�owo z listy jako kandydata do umieszczenia na diagramie,program analizuje ka�d� liter� ka�dego s�owa na li�cie i wyszukuje wszystkiewyst�pienia tej litery w diagramie.Przy ka�dym wyst�pieniu poszukiwanej literyprzeprowadzana jest seria testów, maj�cych na celu sprawdzenie, czy w miejscutego wyst�pienia badane s�owo z listy mo�e zosta� skrzy�owane ze s�owemistniej�cym na diagramie.Z�o�ono�� tego procesu stanowi wspania�e pole dooptymalizacji.Po pierwsze, dla ka�dej litery alfabetu tworzona jest lista jej wyst�pie�(pozycji) w diagramie; ka�dorazowo, gdy nowe s�owo umieszczane jest nadiagramie, listy zwi�zane z jego literami s� uaktualniane.Dzi�ki temu w celuznalezienia wszystkich wyst�pie� ��danej litery wystarczy przetworzy� zwi�zan�z ni� list�, zamiast przeszukiwa� 150 pozycji diagramu.Po drugie, z ka�d� �kratk�� diagramu zwi�zana jest informacja o tym, czy s�owo,do którego owa kratka przynale�y, ma orientacj� poziom� czy pionow�.Informacjata ma posta� dwóch zmiennych boolowskich HorizWord i VertWord; dla kratki nienale��cej do danego s�owa obie te zmienne maj� warto�� false, dla kratkile��cej na przeci�ciu s�ów obydwie równe s� true, dla pozosta�ych kratekdok�adnie jedna z nich równa jest true.Dzi�ki temu, testuj�c dan� pozycj�diagramu jako kandydata na skrzy�owanie s�ów, �atwo mo�emy okre�li� kierunek, wktórym ulokowa� nale�y ewentualne nowe s�owo � jest to ten kierunek, dlaktórego odpowiednia zmienna (HorizWord lub VertWord) ma warto�� false.Po trzecie, z ka�d� kratk� le��c� na przeci�ciu s�ów zwi�zana jest informacja opunktacji tego przeci�cia (score); dla kratek nie le��cych na przeci�ciachwarto�� ta równa jest zeru.Informacja ta tworzona jest w momencie krzy�owanias�ów, a dzi�ki niej obliczenie sumarycznej punktacji zwi�zanej z przeci�ciamiwymaga tylko zsumowania punktacji wszystkich kratek, zamiast czasoch�onnegowykrywania przeci�� i osobnej �wyceny� ka�dego z nich.Obliczaj�ca punktacj�funkcja CalcScore() jest przecie� jednym z �w�skich garde�� aplikacji, cowynika z tabeli 4.2.Wykorzystywanie ró�nego rodzaju tablic przegl�dowych jest szczególnymprzypadkiem bardziej ogólnego aspektu optymalizacji � unikania oblicze�niepotrzebnych, na przyk�ad dubluj�cych si�.Jaskrawym przyk�adem takiego�dublowania� jest w naszej aplikacji dwukrotne sprawdzanie mo�liwo�ciskrzy�owania ka�dej pary s�ów.Je�eli na przyk�ad w li�cie wyst�puj� s�owa JARi ROD, to najpierw do poziomo (na przyk�ad) ulokowanego s�owa JAR dopasowujesi� pionowe skrzy�owanie ROD, a nieco pó�niej do pionowo ulokowanego s�owa RODtworzy si� poziome skrzy�owanie JAR.W obydwu przypadkach wynik jest ten sam, awi�c druga próba okazuje si� wyra�nie niepotrzebna.Rozwi�zanie tego problemu ma charakter do�� skomplikowany, jego istot� jestjednak wprowadzenie pewnego uporz�dkowania s�ów, je�li chodzi o kolejno��pobierania ich do testów; mo�na sformu�owa� w tym wzgl�dzie dwie dosy� ogólneregu�y.Dla pustego diagramu: po umieszczeniu na diagramie pierwszego s�owa kandydatamina utworzenie z nim skrzy�owania s� wy��cznie s�owa wyst�puj�ce w li�cie nadalszych ni� ono pozycjach.Dla diagramu cz�ciowo zape�nionego: w�ród s�ów wyst�puj�cych na li�cie pobadanym s�owie odnajduje si� s�owo najdawniej umieszczone na diagramie � s�owoto wraz z nast�pnymi s�owami na li�cie tworzy zbiór kandydatów do badania namo�liwo�� skrzy�owania z badanym s�owem.Po zaimplementowaniu opisanych usprawnie� ponownie zmierzyli�my czas kompletnejanalizy 11-elementowego zbioru s�ów.Oto wynik:obecny czas wykonania: 24,33 sekundy;usprawnienie w tym kroku: 203600 proc.;przyspieszenie globalne: 3270 razy.To ju� nie s� �arty � takie usprawnienie oznacza skrócenie oblicze� np.z 10lat do jednego dnia! Oto przyk�ad, jak zb�dne operacje potrafi� sparali�owa�ka�de obliczenie.W naszej aplikacji kryje si� jeszcze jedna, tym razem niezbyt spektakularnamo�liwo�� ulepszenia � w celu okre�lenia, czy dana kratka diagramu le�y naskrzy�owaniu s�ów, bada si� zwi�zane z ni� dwie zmienne HorizWord i VertWord,gdy tymczasem wystarczy�oby badanie, czy punktacja zwi�zana z dan� kratk� jestniezerowa.Wprowadzaj�c t� modyfikacj�, otrzymujemy niewielkie, cho� zauwa�alneprzyspieszenie:obecny czas wykonania: 23,68 sekundy;usprawnienie w tym kroku: 2,7 proc.;przyspieszenie globalne: 3360 razy.Jest to znacznie wi�cej, ni� zdzia�a� mo�e nawet najbardziej inteligentnaoptymalizacja automatyczna � wobec czego materialnych kszta�tów nabierastwierdzenie ze wst�pu do rozdzia�u o przewadze optymalizuj�cego programistynad optymalizuj�cym kompilatorem.Wysokopoziomowe techniki optymalizowania generowanego koduIstnieje wiele technik optymalizowania kodu �ród�owego aplikacji pod k�temefektywno�ci kodu generowanego przez kompilator.Nale�y przy okazji pami�ta� otym, i� kod �wygl�daj�cy� optymalnie z punktu widzenia C++ niekoniecznie musiskutkowa� efektywnym kodem wynikowym, a tak�e o tym, i� efektywno�� kodu�ród�owego niekoniecznie idzie w parze z jego czytelno�ci�.Specyfika nowoczesnych procesorówStopie� z�o�ono�ci wspó�czesnych procesorów znajduje si� w �cis�ej relacji zez�o�ono�ci� kodu, jaki przychodzi im wykonywa�.Co prawda jedyn� bezpo�redni�mo�liwo�ci� kontroli kodu wynikowego generowanego z programu napisanego wj�zyku wysokiego poziomu s� wszelkiego rodzaju �wstawki� asemblerowe i nieinaczej jest w C++, jednak�e niektóre postaci kodu �ród�owego daj� kod bardziejefektywny z punktu widzenia architektury konkretnego procesora.W nast�pnychpunktach zak�adamy, i� procesorem, pod k�tem którego optymalizujemy kod naszejaplikacji, jest Pentium II � znakomita wi�kszo�� rozpatrywanych tu jego cechodnosi si� tak�e do równorz�dnych procesorów AMD serii K.Przewidywanie rozga��zie�Najwa�niejsz� cech� sprz�towej optymalizacji procesora Pentium II jestmo�liwo�� statycznego i dynamicznego przewidywania rozga��zie� (ang.branchprediction).W kodzie procesorów serii x86 wyró�ni� mo�emy trzy rodzaje skoków:bezwarunkowe, warunkowe w przód i warunkowe w ty� [ Pobierz całość w formacie PDF ]

do ÂściÂągnięcia > pdf > download > pobieranie > ebook

Menu

Podobne