Différences entre versions de « Jacket »

Ligne 42 : Ligne 42 :
 
</pre>
 
</pre>
  
=== Exemple 2 ===
+
=== Multiplication matricielle ===
  
 
<pre>
 
<pre>
 
addpath(genpath('/local/jacket-2.3/jacket/engine/'))
 
addpath(genpath('/local/jacket-2.3/jacket/engine/'))
  
clear; clear gpu_hook;
+
clear; clear gpu_hook; % La mémoire du CPU et celle du GPU sont effacées.
 
 
% Chronométrons pour comparer le temps de calcul du CPU au temps de calcul du GPU.
 
  
 
minSize = 100; maxSize = 2000; it = 100;
 
minSize = 100; maxSize = 2000; it = 100;
 
 
sizes = minSize:it:maxSize;
 
sizes = minSize:it:maxSize;
 
 
nbSizes = length(sizes);
 
nbSizes = length(sizes);
 
 
timeMultGPU = zeros(nbSizes,1);
 
timeMultGPU = zeros(nbSizes,1);
 
 
timeMultCPU = zeros(nbSizes,1);
 
timeMultCPU = zeros(nbSizes,1);
  
Ligne 66 : Ligne 60 :
  
 
G1=grand(currentSize); G2=grand(currentSize);
 
G1=grand(currentSize); G2=grand(currentSize);
 
 
G3=double(G1); G4=double(G2);
 
G3=double(G1); G4=double(G2);
  
 
timeMultGPU(currentTest) = timeit(@() G1*G2);   
 
timeMultGPU(currentTest) = timeit(@() G1*G2);   
 
 
timeMultCPU(currentTest) = timeit(@() G3*G4);
 
timeMultCPU(currentTest) = timeit(@() G3*G4);
  
Ligne 77 : Ligne 69 :
 
end
 
end
  
timeMultGPU         %Le temps calculé pour le GPU
+
timeMultGPU             % Le temps calculé pour le GPU.
 
+
timeMultCPU             % Le temps calculé pour le CPU.
timeMultCPU         %Le temps calculé pour le CPU
 
 
 
timeMultCPU/timeMultGPU          %Le rapport entre les deux temps calculé.  
 
  
plot(minSize:it:maxSize,timeMultGPU,'-or')
+
timeMultCPU/timeMultGPU % Le rapport des 2 temps.
  
 +
plot(minSize:it:maxSize,timeMultGPU,'-or')  % Affichage des temps sur graphique.
 
hold on
 
hold on
 
 
plot(minSize:it:maxSize,timeMultCPU,'-xb')
 
plot(minSize:it:maxSize,timeMultCPU,'-xb')
  
 
set(gca,'FontSize',16)
 
set(gca,'FontSize',16)
 
 
title('Temps de calcul GPU vs CPU pour la multiplication matricielle')
 
title('Temps de calcul GPU vs CPU pour la multiplication matricielle')
 
 
xlabel('Taille des matrices')
 
xlabel('Taille des matrices')
 
 
ylabel('Temps de calcul (s)')
 
ylabel('Temps de calcul (s)')
 
 
legend('GPU','CPU','Location','NorthWest')
 
legend('GPU','CPU','Location','NorthWest')
 
</pre>
 
</pre>

Version du 25 juin 2013 à 10:50


Jacket Logo.png

Jacket est un toolbox propriétaire pour MATLAB qui permet l'exécution de code sur GPUs. Similaire à GPUmat, son cousin gratuit, pour sa syntaxe, Jacket comprend cependant davantage de fonctions implémentées et accélère également l'affichage des graphismes 2d ou 3d, en faisant usage du GPU.


Guide

Attention : Jacket est installé sur les machines tigre et lionceau seulement.

Présentation donnée par Alexandre Desfossés Foucault : http://dms.umontreal.ca/wiki/images/d/d0/PresentationJacket0.pdf

Exemples

Dans les exemples suivants, la fonction TIMEIT de Jacket est utilisée afin de chronométrer le temps d'exécution d'un segment de code ou d'une fonction tournant sur CPU ou sur GPU.

Addition matricielle

addpath(genpath('/local/jacket-2.3/jacket/engine/'))

clear; clear gpu_hook;    % La mémoire du CPU et celle du GPU sont effacées.

n=6000

Acpu=rand(n,n,'single');  % Déclaration de 2 matrices aléatoires (précision simple) sur CPU.
Bcpu=rand(n,n,'single');

Agpu=gsingle(Acpu);       % Copie des matrices précédentes sur GPU.
Bgpu=gsingle(Bcpu);

tCpuPlus=timeit(@() Acpu+Bcpu);  % Mesure du temps d'exécution de l'addition des 2 matrices
tGpuPlus=timeit(@() Agpu+Bgpu);  % pour le CPU et pour le GPU.

fprintf('Addition: %f\n', tCpuPlus/tGpuPlus);  % Comparaison des 2 temps.

% Résultat : « Addition: 17.26681 »
% L'opération s'est exécutée 17 fois plus rapidement sur GPU.

Multiplication matricielle

addpath(genpath('/local/jacket-2.3/jacket/engine/'))

clear; clear gpu_hook;  % La mémoire du CPU et celle du GPU sont effacées.

minSize = 100; maxSize = 2000; it = 100;
sizes = minSize:it:maxSize;
nbSizes = length(sizes);
timeMultGPU = zeros(nbSizes,1);
timeMultCPU = zeros(nbSizes,1);

currentTest = 1;

for currentSize = minSize:it:maxSize

	G1=grand(currentSize); G2=grand(currentSize);
	G3=double(G1); G4=double(G2);

	timeMultGPU(currentTest) = timeit(@() G1*G2);  
	timeMultCPU(currentTest) = timeit(@() G3*G4);

	currentTest = currentTest + 1;

end

timeMultGPU              % Le temps calculé pour le GPU.
timeMultCPU              % Le temps calculé pour le CPU.

timeMultCPU/timeMultGPU  % Le rapport des 2 temps. 

plot(minSize:it:maxSize,timeMultGPU,'-or')  % Affichage des temps sur graphique.
hold on
plot(minSize:it:maxSize,timeMultCPU,'-xb')

set(gca,'FontSize',16)
title('Temps de calcul GPU vs CPU pour la multiplication matricielle')
xlabel('Taille des matrices')
ylabel('Temps de calcul (s)')
legend('GPU','CPU','Location','NorthWest')

Exemple 3 (GFOR)

Dans cet exemple on va exécuter plusieurs itérations d'une boucle «for» simultanément sur le GPU. Tous les m multiplications matricielles sont réalisées simultanément.

clear; clear gpu_hook;

addpath(genpath('/local/jacket-2.3/jacket/engine/'))


n=5;
m=20;

A = grand(n,n,m);  % On crée une matrice (un tableau) sur le GPU.

B = gones(n);

gfor p = 1:m

    A(:,:,p) = A(:,:,p) * B

gend

Voir aussi

Articles connexes

Références externes


La dernière modification de cette page a été faite le 25 juin 2013 à 10:50.