Mã C ++ để tạo DAG ngẫu nhiên
Tôi đã viết mã C ++ sau đây một lúc trước để tạo đồ thị ngẫu nhiên cho một dự án mà tôi đang làm việc:
#include "stdafx.h"
#include <iostream>
#include <algorithm> // std::min_element, std::max_element
#include <sstream>
#include <fstream>
#include <string>
#include <iterator>
#include <random>
#include <vector>
#define NoOfNodes 30
struct GPU_data
{
int number_Copies;
int workItems;
int workGroups;
bool memory;
double power_consumption;
double execTime;
};
struct DAG_data
{
int processid; //Node's ID
int PEid; //Processor's ID to which node is assigned
std::vector<GPU_data> Node_config;
int precede;
int follow; //nodes following this node
int noOfCopies;
double transData;
double ExecTime;
double powerDraw;
};
void CreateandAssignEdges(DAG_data Sample, int NoOfEdges)
{
unsigned int i = 0;
if (Sample.processid == 0)
{
//parent process- so there will be no edges
Sample.precede = 0;
Sample.follow = rand()% NoOfEdges + 1;
}
else if (Sample.processid == NoOfNodes - 1)
{
//sink process- so there will be no following edges
Sample.follow = 0;
}
else
{
//which nodes will the edges connect to (Anywhere from among the following nodes, including the sink node)
Sample.follow = (Sample.processid + 1) + (std::rand() % (29 - (Sample.processid) + 1));
if (Sample.follow == 30)
{
Sample.follow -= 1;
}
}
}
DAG_data EdgeAssignment(DAG_data Sample, int NoOfEdges)
{
unsigned int i = 0;
if (Sample.processid == 0)
{
//parent process- so there will be no edges
Sample.precede = 0;
Sample.follow = rand() % NoOfEdges + 1;
return Sample;
}
else if (Sample.processid == NoOfNodes - 1)
{
//sink process- so there will be no following edges
Sample.follow = 0;
return Sample;
}
else
{
//which nodes will the edges connect to (Anywhere from among the following nodes, including the sink node)
Sample.follow = (Sample.processid + 1) + (std::rand() % (29 - (Sample.processid) + 1));
return Sample;
}
}
//Sample->precede = rand() % NoOfEdges;
//Sample->follow = rand() % NoOfEdges;
////Preceding and following edges of a node should not be the same.
//while (Sample->precede > Sample->follow || Sample->precede == Sample->follow)
//{
// //assign both edges again
// Sample->follow = rand() % NoOfEdges;
// Sample->precede = rand() % NoOfEdges;
//}
void whenPEisGPU(DAG_data Sample, int processorID)
{
GPU_data emptySet;
int i = 0;
int NoOfConfigs = rand() % 5;
GPU_data* sub_tasks = &emptySet;
while (i != NoOfConfigs)
{
sub_tasks->memory = rand() % 1;
sub_tasks->number_Copies = rand() % 3;
sub_tasks->workGroups = rand() % 10 +1;
sub_tasks->workItems = rand() % (sub_tasks->workGroups * 2) + 1;
sub_tasks->power_consumption = rand() % 250;
sub_tasks->execTime = rand() % (int)(Sample.ExecTime / 2);
Sample.Node_config.push_back(*sub_tasks);
i++;
}
}
void PESpecificParameters(DAG_data Sample, int processorID)
{
if (processorID == 0)
{
Sample.ExecTime = rand() % 100;
Sample.powerDraw = 0.0;
Sample.noOfCopies = 0;
}
else if (processorID == 1)
{
Sample.PEid = processorID;
//whenPEisGPU(Sample, processorID);
int i = 0;
int NoOfConfigs = rand() % 5;
GPU_data sub_tasks;
while (i != NoOfConfigs)
{
sub_tasks.memory = rand() % 1;
sub_tasks.number_Copies = rand() % 3+1;
sub_tasks.workGroups = rand() % 10 + 1;
sub_tasks.workItems = rand() % (sub_tasks.workGroups * 2) + 1;
sub_tasks.power_consumption = rand() % 250;
sub_tasks.execTime = rand() % (int)(Sample.ExecTime / 2);
Sample.Node_config.push_back(sub_tasks);
i++;
}
}
}
DAG_data PEParameters(DAG_data Sample, int processorID)
{
if (processorID == 0)
{
Sample.ExecTime = rand() % 100;
Sample.powerDraw = 0.0;
Sample.noOfCopies = 0;
return Sample;
}
else if (processorID == 1)
{
Sample.PEid = processorID;
//whenPEisGPU(Sample, processorID);
int i = 0;
int NoOfConfigs = rand() % 5;
GPU_data sub_tasks;
while (i != NoOfConfigs)
{
sub_tasks.memory = rand() % 1;
sub_tasks.number_Copies = rand() % 3 + 1;
sub_tasks.workGroups = rand() % 10 + 1;
sub_tasks.workItems = rand() % (sub_tasks.workGroups * 2) + 1;
sub_tasks.power_consumption = rand() % 250;
sub_tasks.execTime = rand() % (int)(Sample.ExecTime / 2) + 1;
Sample.Node_config.push_back(sub_tasks);
i++;
}
return Sample;
}
}
void generateEdges(std::vector<DAG_data> &myTaskGraph)
{
unsigned int i = 0;
while (i != myTaskGraph.size())
{
for (unsigned int j = (myTaskGraph[i].processid)+1; j < myTaskGraph.size(); j++)
{
if (myTaskGraph[i].follow == 30)
{
myTaskGraph[i].follow -= 1;
}
//create an edge between the current node and any of its following nodes according to the following random number
if (rand() % 100 < 30)
{
myTaskGraph[i].follow = j;
break;
}
}
i++;
}
}
int main()
{
DAG_data emptyDAG;
unsigned int i = 0;
std::ofstream myFile;
std::vector<DAG_data> All_DAGs;
while (i != NoOfNodes)
{
DAG_data DAG1;
DAG1.processid = i;
DAG1.transData = i + 1;
DAG1.PEid = 0;
DAG1= PEParameters(DAG1, DAG1.PEid);
DAG1= EdgeAssignment(DAG1, 10);
All_DAGs.push_back(DAG1);
//DAG1.Node_config.clear();
i++;
}
generateEdges(All_DAGs);
for (int h = 0; h < All_DAGs.size(); h++)
{
if (h % 2 != 0)
{
DAG_data forNewPE =PEParameters(All_DAGs[h], 1);
All_DAGs.push_back(forNewPE);
All_DAGs[h].Node_config.clear();
if (All_DAGs[h].processid ==29)
{
break;
}
}
}
myFile.open("TG_Data_30NewEdges.txt");
for (int i = 0; i < All_DAGs.size(); i++)
{
myFile << "Node id: " << All_DAGs[i].processid << std::endl;
myFile << "Following Edge: " << All_DAGs[i].follow << std::endl;
myFile << "Transfer Data: " << All_DAGs[i].transData << std::endl;
myFile << "Node PE: " << All_DAGs[i].PEid << std::endl;
if (All_DAGs[i].PEid == 0)
{
myFile << "Execution time: " << All_DAGs[i].ExecTime << std::endl;
}
else
{
myFile << "-------------------------------" << std::endl;
for (int j = 0; j < All_DAGs[i].Node_config.size(); j++)
{
myFile << "Execution time: " << All_DAGs[i].Node_config[j].execTime << std::endl;
myFile << "Copies: " << All_DAGs[i].Node_config[j].number_Copies << std::endl;
myFile << "Memory: " << All_DAGs[i].Node_config[j].memory << std::endl;
myFile << "Work-Items: " << All_DAGs[i].Node_config[j].workItems << std::endl;
myFile << "Work-Groups: " << All_DAGs[i].Node_config[j].workGroups << std::endl;
myFile << "Power: " << All_DAGs[i].Node_config[j].power_consumption << std::endl;
myFile << "++++++++++++++++++" << std::endl;
}
}
myFile << "=================" << std::endl;
}
myFile.close();
std::cout << "DONE NOW." << std::endl;
std::cin.get();
}
Mã đã hoàn thành mục tiêu của nó đối với tôi nhưng có rất nhiều chỗ để cải thiện cho mã này. Vui lòng cho biết cách mã này có thể được viết lại để tuân thủ tốt hơn các thực hành C ++ mong muốn.
Trả lời
Các lỗi quan trọng:
ngẫu nhiên của bạn không phải là ngẫu nhiên (gieo nó)
ngẫu nhiên của bạn không đồng nhất (sử dụng phân phối đồng nhất thay vì chỉ sử dụng mô-đun, điều này sẽ làm lệch phân phối)
precede
thường chưa được khởi tạo;NoOfConfigs
thường chưa được khởi tạo và không bao giờ được sử dụng?Vòng lặp cuối cùng trước khi ghi tệp đầu ra sẽ sửa đổi bộ sưu tập trong khi lặp lại :
for (size_t h = 0; h < nodes.size(); h++) { // ... nodes.push_back(forNewPE);
Đây là một mô hình chống. Bạn chỉ thoát khỏi nó vì
if (nodes[h].processid == 29) { break; }
tất nhiên là bị mắc số ma thuật, và thay vào đó có thể dễ dàng đưa vào điều kiện vòng lặp:
for (size_t h = 0; h < NoOfNodes; ++h) {
void PESpecificParameters(DAG_data Sample, int processorID)
Không được sử dụng.Khi được sử dụng, nó sẽ không bao giờ có bất kỳ tác dụng nào (vì nó có các giá trị trả về của netiher cũng như chứa các tham chiếu đến bất kỳ thứ gì bên ngoài)
Giống với
whenPEisGPU
Sau khi loại bỏ mã trùng lặp, có vẻ như
PEParameters
là giống hệt nhau đểPESpecificParameters
(xem dưới đây)Tương tự như vậy
CreateandAssignEdges
đã được sử dụng và có vẻ như đang sao chépEdgeAssignment
?
Các lưu ý chính:
Đặt tên!
DAG_Data
có nghĩa là bên cạnh không có gì. Mô hình đồ thị của bạn đại diện cho điều gì đó trong cuộc sống thực. Việc nó là một DAG giống như việc gọi các biến là "textstring" thay vì "FirstName" và "ZipCode"Giải nén một số chức năng. Sử dụng chúng để
- trách nhiệm riêng biệt,
- mức độ trừu tượng
- giảm sự trùng lặp
Tùy chọn nhóm các chức năng liên quan với dữ liệu của chúng thành các lớp (xem phần "THƯỞNG" bên dưới)
Đây là một cú đánh bởi những điều tôi đã giải quyết:
Sử dụng các cảnh báo (tối thiểu -Wall -Wextra -pedantic) và swat chúng:
test.cpp:43:18: warning: unused variable ‘i’ [-Wunused-variable] 43 | unsigned int i = 0; test.cpp:74:18: warning: unused variable ‘i’ [-Wunused-variable] 74 | unsigned int i = 0; test.cpp:119:39: warning: unused parameter ‘processorID’ [-Wunused-parameter] 119 | void whenPEisGPU(DAG_data Sample, int processorID) test.cpp:259:23: warning: comparison of integer expressions of different signedness: ‘int’ and ‘std::vector<DAG_data>::size_type’ {aka ‘long unsigned int’} [-Wsign-compare] 259 | for (int h = 0; h < All_DAGs.size(); h++) test.cpp:277:23: warning: comparison of integer expressions of different signedness: ‘int’ and ‘std::vector<DAG_data>::size_type’ {aka ‘long unsigned int’} [-Wsign-compare] 277 | for (int i = 0; i < All_DAGs.size(); i++) test.cpp:290:31: warning: comparison of integer expressions of different signedness: ‘int’ and ‘std::vector<GPU_data>::size_type’ {aka ‘long unsigned int’} [-Wsign-compare] 290 | for (int j = 0; j < All_DAGs[i].Node_config.size(); j++) test.cpp:204:1: warning: control reaches end of non-void function [-Wreturn-type] 204 | }
Các thay đổi:
CreateandAssignEdges: - unsigned int i = 0; EdgeAssignment: - unsigned int i = 0; -void whenPEisGPU(DAG_data Sample, int processorID) +void whenPEisGPU(DAG_data Sample, int /*processorID*/) PEParameters: + throw std::range_error("processorID"); - for (int h = 0; h < All_DAGs.size(); h++) + for (size_t h = 0; h < All_DAGs.size(); h++) - for (int i = 0; i < All_DAGs.size(); i++) + for (size_t i = 0; i < All_DAGs.size(); i++) - for (int j = 0; j < All_DAGs[i].Node_config.size(); j++) + for (size_t j = 0; j < All_DAGs[i].Node_config.size(); j++)
Chạy hiện đại hóa / kiểm tra khả năng đọc cho thấy rất nhiều cảnh báo số ảo và một số cải tiến dễ dàng:
clang-apply-replacements version 9.0.0 clang-tidy-9 -header-filter=.* -checks=-*,readability-*,modernize-*,-modernize-use-trailing-return-type -export-fixes /tmp/tmp6CfbSr/tmpYGk6CX.yaml -p=/home/sehe/Projects/stackoverflow /home/sehe/Projects/stackoverflow/test.cpp /home/sehe/Projects/stackoverflow/test.cpp:59:66: warning: 29 is a magic number; consider replacing it with a named constant [readability-magic-numbers] Sample.follow = (Sample.processid + 1) + (std::rand() % (29 - (Sample.processid) + 1)); ^ /home/sehe/Projects/stackoverflow/test.cpp:61:30: warning: 30 is a magic number; consider replacing it with a named constant [readability-magic-numbers] if (Sample.follow == 30) ^ /home/sehe/Projects/stackoverflow/test.cpp:81:5: warning: do not use 'else' after 'return' [readability-else-after-return] else if (Sample.processid == NoOfNodes - 1) ^~~~~ /home/sehe/Projects/stackoverflow/test.cpp:92:66: warning: 29 is a magic number; consider replacing it with a named constant [readability-magic-numbers] Sample.follow = (Sample.processid + 1) + (std::rand() % (29 - (Sample.processid) + 1)); ^ /home/sehe/Projects/stackoverflow/test.cpp:119:32: warning: 5 is a magic number; consider replacing it with a named constant [readability-magic-numbers] int NoOfConfigs = rand() % 5; ^ /home/sehe/Projects/stackoverflow/test.cpp:123:29: warning: implicit conversion 'int' -> bool [readability-implicit-bool-conversion] sub_tasks->memory = rand() % 1; ^ (( ) != 0) /home/sehe/Projects/stackoverflow/test.cpp:125:42: warning: 10 is a magic number; consider replacing it with a named constant [readability-magic-numbers] sub_tasks->workGroups = rand() % 10 +1; ^ /home/sehe/Projects/stackoverflow/test.cpp:127:49: warning: 250 is a magic number; consider replacing it with a named constant [readability-magic-numbers] sub_tasks->power_consumption = rand() % 250; ^ /home/sehe/Projects/stackoverflow/test.cpp:138:36: warning: 100 is a magic number; consider replacing it with a named constant [readability-magic-numbers] Sample.ExecTime = rand() % 100; ^ /home/sehe/Projects/stackoverflow/test.cpp:148:36: warning: 5 is a magic number; consider replacing it with a named constant [readability-magic-numbers] int NoOfConfigs = rand() % 5; ^ /home/sehe/Projects/stackoverflow/test.cpp:152:32: warning: implicit conversion 'int' -> bool [readability-implicit-bool-conversion] sub_tasks.memory = rand() % 1; ^ (( ) != 0) /home/sehe/Projects/stackoverflow/test.cpp:154:45: warning: 10 is a magic number; consider replacing it with a named constant [readability-magic-numbers] sub_tasks.workGroups = rand() % 10 + 1; ^ /home/sehe/Projects/stackoverflow/test.cpp:156:52: warning: 250 is a magic number; consider replacing it with a named constant [readability-magic-numbers] sub_tasks.power_consumption = rand() % 250; ^ /home/sehe/Projects/stackoverflow/test.cpp:170:36: warning: 100 is a magic number; consider replacing it with a named constant [readability-magic-numbers] Sample.ExecTime = rand() % 100; ^ /home/sehe/Projects/stackoverflow/test.cpp:177:5: warning: do not use 'else' after 'return' [readability-else-after-return] else if (processorID == 1) ^~~~~ /home/sehe/Projects/stackoverflow/test.cpp:182:36: warning: 5 is a magic number; consider replacing it with a named constant [readability-magic-numbers] int NoOfConfigs = rand() % 5; ^ /home/sehe/Projects/stackoverflow/test.cpp:186:32: warning: implicit conversion 'int' -> bool [readability-implicit-bool-conversion] sub_tasks.memory = rand() % 1; ^ (( ) != 0) /home/sehe/Projects/stackoverflow/test.cpp:188:45: warning: 10 is a magic number; consider replacing it with a named constant [readability-magic-numbers] sub_tasks.workGroups = rand() % 10 + 1; ^ /home/sehe/Projects/stackoverflow/test.cpp:190:52: warning: 250 is a magic number; consider replacing it with a named constant [readability-magic-numbers] sub_tasks.power_consumption = rand() % 250; ^ /home/sehe/Projects/stackoverflow/test.cpp:211:42: warning: 30 is a magic number; consider replacing it with a named constant [readability-magic-numbers] if (myTaskGraph[i].follow == 30) ^ /home/sehe/Projects/stackoverflow/test.cpp:216:26: warning: 100 is a magic number; consider replacing it with a named constant [readability-magic-numbers] if (rand() % 100 < 30) ^ /home/sehe/Projects/stackoverflow/test.cpp:216:32: warning: 30 is a magic number; consider replacing it with a named constant [readability-magic-numbers] if (rand() % 100 < 30) ^ /home/sehe/Projects/stackoverflow/test.cpp:246:36: warning: 10 is a magic number; consider replacing it with a named constant [readability-magic-numbers] DAG1= EdgeAssignment(DAG1, 10); ^ /home/sehe/Projects/stackoverflow/test.cpp:264:41: warning: 29 is a magic number; consider replacing it with a named constant [readability-magic-numbers] if (All_DAGs[h].processid ==29) ^ /home/sehe/Projects/stackoverflow/test.cpp:274:5: warning: use range-based for loop instead [modernize-loop-convert] for (size_t i = 0; i < All_DAGs.size(); i++) ^ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (auto & All_DAG : All_DAGs) 7510 warnings generated. Suppressed 7485 warnings (7485 in non-user code). Use -header-filter=.* to display errors from all non-system headers. Use -system-headers to display errors from system headers as well. Applying fixes ...
Ít nhất hãy thực hiện vòng lặp ranged-for ngay lập tức:
for (auto& DAG : All_DAGs) { myFile << "Node id: " << DAG.processid << std::endl; myFile << "Following Edge: " << DAG.follow << std::endl; myFile << "Transfer Data: " << DAG.transData << std::endl; myFile << "Node PE: " << DAG.PEid << std::endl; if (DAG.PEid == 0) { myFile << "Execution time: " << DAG.ExecTime << std::endl; } else { myFile << "-------------------------------" << std::endl; for (auto& cfg : DAG.Node_config) { myFile << "Execution time: " << cfg.execTime << std::endl; myFile << "Copies: " << cfg.number_Copies << std::endl; myFile << "Memory: " << cfg.memory << std::endl; myFile << "Work-Items: " << cfg.workItems << std::endl; myFile << "Work-Groups: " << cfg.workGroups << std::endl; myFile << "Power: " << cfg.power_consumption << std::endl; myFile << "++++++++++++++++++" << std::endl; } } myFile << "=================" << std::endl; }
Đừng tách phần khởi tạo ra khỏi khai báo một cách không cần thiết.
std::ofstream myFile; // 40 lines... myFile.open("TG_Data_30NewEdges.txt");
Đừng quản lý tài nguyên theo cách thủ công một cách không cần thiết:
myFile.close();
Mẫu RAII của C ++ có nghĩa là tệp sẽ luôn được đóng.
{ std::ofstream output("TG_Data_30NewEdges.txt"); for (auto& DAG : All_DAGs) { // ... } }
Lưu ý rằng tôi cũng đã đổi tên thành
myFile
một cái gì đó mô tả hơn.Đã đến lúc giải nén một số chức năng ở trên:
std::ofstream output("TG_Data_30NewEdges.txt"); writeReport(output, All_DAGs);
Và sau đó ở một nơi khác:
using DAGs = std::vector<DAG_data>; void writeReport(std::ostream& output, DAGs const& graphs) { for (auto& g : graphs) { // ... } }
Loại bỏ các vòng lặp bí mật
unsigned int i = 0; while (i != myTaskGraph.size()) { // ... i++; }
Thông thường được viết là
for (size_t i = 0; i < myTaskGraph.size(); ++i) { // ... }
Hoặc, kể từ c ++ 0x:
for (Node& node : myTaskGraph) { // ... }
Tương tự như vậy, các vòng lặp xây dựng vùng chứa có thể nên đọc thêm như:
Nodes nodes(NoOfNodes); size_t i = 0; for (auto& current : nodes) { current.processid = i; current.transData = i + 1; current.PEid = 0; i++; current = PEParameters(current, current.PEid); current = EdgeAssignment(current, 10); }
Và
void whenPEisGPU(Node& node, int /*processorID*/) { int NoOfConfigs = rand() % 5; node.Node_config.assign(NoOfConfigs, {}); for (auto& sub_task : node.Node_config) { sub_task.memory = ((rand() % 1) != 0); sub_task.number_Copies = rand() % 3; sub_task.workGroups = rand() % 10 +1; sub_task.workItems = rand() % (sub_task.workGroups * 2) + 1; sub_task.power_consumption = rand() % 250; sub_task.execTime = rand() % (int)(node.ExecTime / 2); } }
Vân vân.
Tôi có thể viết chúng dưới dạng
std::generate_n
cuộc gọi trong cuộc sống thực, nhưng có lẽ chúng tôi sẽ tự nhiên đến đó, sau đó bên dướiĐặt tên. Ở đâu đó nửa đoạn mã, đột nhiên chúng tôi nhận được một cái nhìn thoáng qua về những gì chúng tôi đang thực sự xử lý:
void generateEdges(std::vector<DAG_data> &myTaskGraph)
Vì vậy, tôi đoán chúng ta có thể đặt tên
DAG_data
Node
hoặcTask
(hoặc thậm chíTaskNode
?).Tương tự như vậy, chúng tôi nhận được những gợi ý tinh tế ở đây:
if (Sample.processid == 0) { //parent process- so there will be no edges
và
else if (node.processid == NoOfNodes - 1) { // sink process- so there will be no following edges
Lưu ý bên: bạn sử dụng
parent
như thể nó có nghĩa là "không có cạnh". Đó là demonstratively không chính xác, bởi vì bạn ngay lập tức làm thiết lập một cạnh đi theo. Ý bạn có vẻ là "cha mẹ không có cha mẹ", trong DAG thường được gọi là "gốc". Cũng cần lưu ý, nếu bạn có một DAG chỉ có 1 gốc, tại sao không gọi nó là Cây?// tệp dưới: đặt tên là quan trọng
Vì vậy, chúng ta nên làm cho nó dễ đọc hơn:
using ProcessID = int; static constexpr size_t NoOfNodes = 30; static constexpr ProcessID RootNodeId = 0; static constexpr ProcessID SinkNodeId = NoOfNodes - 1; // ... static bool constexpr IsSink(ProcessID id) { return SinkNodeId == id; } static bool constexpr IsSink(Node const& node) { return IsSink(node.processid); } // etc?
Trên thực tế, có lẽ tốt hơn nên kết hợp toàn bộ:
enum ProcessID : int { RootNodeId = 0, NoOfNodes = 30, SinkNodeId = NoOfNodes -1, };
Điều này dẫn đến việc giảm đáng kể tất cả các số ma thuật (
= 0
trở thành= RootNodeId
vv).Tuy nhiên, nó buộc chúng ta phải giải quyết vấn đề với các nhiệm vụ "ma thuật" khác:
node.follow = rand() % NoOfEdges + 1; node.follow = (node.processid + 1) + (std::rand() % (29 - (node.processid) + 1));
Ý tôi là, chúng ta sẽ giải quyết những vấn đề đó (bởi vì, ugh và lệch ngẫu nhiên).
Vì vậy, hãy giải quyết ngẫu nhiên! Bạn đã bắt đầu một cách chính xác:
#include <random>
nhưng không bao giờ sử dụng một thứ từ kho báu đó !
std::mt19937 prng { std::random_device{} () };
Bây giờ chúng ta có UniformRandomBitGenerator và chúng ta đã gieo nó một cách an toàn!
Hãy tạo một số hàm trợ giúp sẽ giúp chúng ta tạo các số được phân phối đồng đều:
Tạo các số lên đến và bao gồm tối đa:
auto gen_number(int max, bool includeZero = true) { using Dist = std::uniform_int_distribution<>; using Param = Dist::param_type; static Dist dist; auto min = includeZero? 0:1; assert(max >= min); return dist(prng, Param(min, max)); }
Thêm một ván bài ngắn cho [1, tối đa] mẫu ngẫu nhiên:
auto gen_positive(int max) { return gen_number(max, false); }
Bây giờ, để tạo ProcessID, chúng tôi cần một số chuyển đổi và chúng tôi có thể giả định một số giá trị mặc định cho các giới hạn phạm vi:
ProcessID gen_follower(int from = FirstFollow, int to = NoOfNodes) { using T = std::underlying_type_t<ProcessID>; using Dist = std::uniform_int_distribution<T>; using Param = Dist::param_type; static Param full{static_cast<T>(FirstFollow), static_cast<T>(NoOfNodes)}; static Dist dist(full); return static_cast<ProcessID>(dist(prng, Param(from, to))); }
Bây giờ chúng ta có thể diễn đạt lại các biểu thức:
// node.follow = rand() % NoOfEdges + 1; node.follow = gen_follower(FirstFollow, NoOfEdges);
Và
// node.follow = // (node.processid + 1) + (std::rand() % (29 - (node.processid) + 1)); node.follow = gen_follower(node.processid+1);
Đơn giản hơn nhiều, an toàn và thống nhất!
Bây giờ, có một số điều kỳ lạ về điều này.
Mọi nơi
follow
được ngụ ý là từProcessId
miền. Tuy nhiên, biểu thứcgen_follower(FirstFollow, NoOfEdges)
sử dụngNoOfEdges
thay vìNoOfNodes
?!NoOfEdges
cũng chỉ được mã hóa cứng10
cho một cuộc gọi tớiEdgeAssignment
.Bạn có chắc là bạn muốn giới hạn "tùy ý" các nút người theo dõi cho Nút gốc
[1..10]
bất kể khôngNoOfNodes
?Vì những người theo dõi tiếp theo luôn được đưa "xuống dòng" nên tôi có thể đoán rằng bạn muốn chọn từ một phân vùng "10 đầu tiên" chỉ để tăng khả năng các nhiệm vụ phụ sinh ra "cháu lớn". Nếu vậy, tên
NoOfEdges
này hoàn toàn gây hiểu lầm và có thể là một cái gì đó như thếFirstGenerationNodes
nào?)Có hai vị trí mà kết quả của các biểu thức này đang được sửa:
if (myTaskGraph[i].follow == 30) { myTaskGraph[i].follow -= 1; } if (Sample.follow == 30) { Sample.follow -= 1; }
Nếu đó là phạm vi mong muốn, chỉ cần sửa các biểu thức của bạn!
Như đã viết, nó làm cho mã khó hiểu, phân chia trách nhiệm trên các chức năng (dẫn đến lỗi) và cũng làm sai lệch thêm phân phối:
29
bây giờ là một mục tiêu cạnh có nhiều khả năng hơn.Tôi đã chọn sửa biểu thức để phù hợp với ý định ngụ ý từ nhận xét khác này:
// which nodes will the edges connect to (Anywhere from among the // following nodes, including the sink node) node.follow = gen_follower(node.processid+1, SinkNodeId);
Sao mã. Việc tạo ra các nhiệm vụ con (
node.Node_config
) được sao chép, với một số khác biệt giả có thể là lỗi, nhưng có thể là cố ý?Ví dụ:
sub_task.number_Copies = rand() % 3 + 1;
Một trong ba bản sao bị bỏ qua
+1
có thể là một lỗi.Theo cách tương tự, chúng tôi thấy một bản sao của
sub_task.execTime = rand() % static_cast<int>(node.ExecTime / 2);
điều đó thêm một
+1
. Có khả năng điều này tránh được số khôngexecTime
, và là một mùi mã mà điều này cũng nên là một phân phối ngẫu nhiên thực đồng nhất, được đánh máy mạnh.Thật khó để đoán những gì bạn thực sự muốn
execTime
nói. Nếu bạn muốn nói rằng thời gian thực thi của nút cha luôn tính tổng các nhiệm vụ con của chúng, thì điều đó sẽ dễ dàng hơn nhiều để diễn đạt với một số logic nghiệp vụ, thay vì để dữ liệu dư thừa trong cấu trúc dữ liệu của bạn và thêm các bất biến không có tài liệu (một lần nữa, mời lỗi ).Để cho vui, tôi đã thêm cách tôi viết bản phân phối theo ý thích:
void distributeExecTime(Node& node) { std::vector<double> weights; std::uniform_real_distribution<> dist; std::generate_n( back_inserter(weights), node.Node_config.size(), [&dist] { return dist(prng); }); auto total_w = std::accumulate(begin(weights), end(weights), 0.); for (size_t i = 0; i < weights.size(); ++i) { node.Node_config[i].execTime = (weights[i]/total_w) * node.ExecTime; } }
Đối với tổng công suất dường như có những điều tương tự đang xảy ra. Có lẽ bạn có thể thay thế powerDraw bằng một hàm:
double powerDraw() const { return std::accumulate(begin(Node_config), end(Node_config), 0.); };
TẶNG KEM
Nhìn qua, chúng ta có thể hình dung một thế giới mà việc tạo là "tự động", cũng như báo cáo:
Cân nhắc việc chuyển thế hệ thành các hàm tạo:
struct GPU_data { int number_Copies = gen_positive(3); int workGroups = gen_positive(10); // order is important! int workItems = gen_positive(workGroups * 2); bool memory = odds(50); double power_consumption = gen_real(249); double execTime = 0; // see distributeExecTime };
Ghi chú
- chúng tôi đang sử dụng C ++ 11 NSMI để tạo phương thức khởi tạo mặc định cho chúng tôi
struct Node { enum Type { CPUNode, GPUNode }; Type PEid; // Processor's ID to which node is assigned ProcessID processid; // Node's ID Configs sub_tasks; ProcessID follow = RootNodeId; // nodes following this node double transData = 0; double ExecTime = 0; explicit Node(int id, int NoOfEdges = 10) : PEid(CPUNode), processid(ProcessID(id)), transData(id + 1) { PEParameters(); EdgeAssignment(NoOfEdges); } explicit Node(Node const& node) : PEid(GPUNode), processid(node.processid), sub_tasks(), follow(node.follow), transData(node.transData), ExecTime(node.ExecTime) { PEParameters(); } double powerDraw() const; bool isGPU() const { return PEid == GPUNode; } private: void PEParameters(); void EdgeAssignment(int NoOfEdges); void distributeExecTime(); };
Bây giờ,
Node
có thể nhóm với các chức năng thao tác của nó:Loại này giả định rằng các loại không được sử dụng ở nơi khác. Trong trường hợp không phải như vậy, chúng ta có thể phân lớp các kiểu và hưởng lợi từ việc cắt đối tượng để chuyển đổi trở lại lớp cơ sở của nó.
Cũng lưu ý rằng một số vị trí trong mã (PEParameters, output và EdgeAssignment) chuyển đổi hành vi trên PEid dường như chỉ có hai giá trị hợp lệ. Tôi đã thay đổi điều đó thành một enum phản ánh sự thật đó:
enum Type { CPUNode, GPUNode }; Type PEid; // Processor's ID to which node is assigned
Như một bài tập cho người đọc, có thể hợp lý nếu thay đổi
Node
sang một số loại đa hình thay vì chuyển đổi mọi lúc:using Node = std::variant<CPUNode, GPUNode>;
Hoặc sử dụng các kiểu ảo (kế thừa).
(Các) danh sách demo
Tất cả thông tin liên lạc đều ở đây trong một Gist: https://gist.github.com/sehe/32c07118031a049042bd9fb469355caf/revisions
Trực tiếp trên Coliru
#include <iostream>
#include <algorithm> // std::min_element, std::max_element
#include <fstream>
#include <string>
#include <random>
#include <vector>
#include <cassert>
namespace {
static std::mt19937 prng { std::random_device{} () };
enum ProcessID : int {
RootNodeId /*= 0 */,
NoOfNodes = 30,
FirstFollow = RootNodeId +1,
SinkNodeId = NoOfNodes -1,
};
auto gen_number(int max, bool includeZero = true) {
using Dist = std::uniform_int_distribution<>;
using Param = Dist::param_type;
static Dist dist;
auto min = includeZero? 0:1;
assert(max >= min);
return dist(prng, Param(min, max));
}
auto gen_positive(int max) {
return gen_number(max, false);
}
ProcessID gen_follower(int from = FirstFollow, int to = NoOfNodes) {
using T = std::underlying_type_t<ProcessID>;
using Dist = std::uniform_int_distribution<T>;
using Param = Dist::param_type;
static Param full{static_cast<T>(FirstFollow), static_cast<T>(NoOfNodes)};
static Dist dist(full);
return static_cast<ProcessID>(dist(prng, Param(from, to)));
}
bool odds(int percentage) {
if (percentage == 100)
return true;
assert(percentage > 0 && percentage < 100);
return std::discrete_distribution<bool>(percentage, 100-percentage)(prng);
}
double gen_real(double mean = 100.0, double stddev = 0) {
if (stddev == 0)
stddev = mean/4;
assert(stddev>0);
return std::normal_distribution(mean, stddev)(prng);
}
}
struct GPU_data {
int number_Copies = gen_positive(3);
int workGroups = gen_positive(10); // order is important!
int workItems = gen_positive(workGroups * 2);
bool memory = odds(50);
double power_consumption = gen_real(249);
double execTime = 0; // see distributeExecTime
};
using Configs = std::vector<GPU_data>;
struct Node {
enum Type { CPUNode, GPUNode };
Type PEid; // Processor's ID to which node is assigned
ProcessID processid; // Node's ID
Configs sub_tasks;
ProcessID follow = RootNodeId; // nodes following this node
double transData = 0;
double ExecTime = 0;
explicit Node(int id, int NoOfEdges = 10)
: PEid(CPUNode),
processid(ProcessID(id)),
transData(id + 1)
{
PEParameters();
EdgeAssignment(NoOfEdges);
}
explicit Node(Node const& node)
: PEid(GPUNode),
processid(node.processid),
sub_tasks(),
follow(node.follow),
transData(node.transData),
ExecTime(node.ExecTime)
{
PEParameters();
}
double powerDraw() const {
double total = 0;
for (auto& sub: sub_tasks) {
total += sub.power_consumption;
}
return total;
};
bool isGPU() const { return PEid == GPUNode; }
private:
void PEParameters() {
switch(PEid) {
case CPUNode:
ExecTime = gen_real(100.0);
break;
case GPUNode:
sub_tasks.resize(gen_number(5));
distributeExecTime();
break;
default:
throw std::range_error("PEid");
}
}
void EdgeAssignment(int NoOfEdges) {
if (processid == RootNodeId) {
// parent process- so there will be no edges
follow = gen_follower(FirstFollow, NoOfEdges);
}
else if (processid == SinkNodeId) {
// sink process- so there will be no following edges
follow = RootNodeId;
}
else {
// which nodes will the edges connect to (Anywhere from among the
// following nodes, including the sink node)
follow = gen_follower(processid+1, SinkNodeId);
}
}
void distributeExecTime() {
std::vector<double> weights;
std::uniform_real_distribution<> dist;
std::generate_n(
back_inserter(weights),
sub_tasks.size(),
[&dist] { return dist(prng); });
auto total_w = std::accumulate(begin(weights), end(weights), 0.);
for (size_t i = 0; i < weights.size(); ++i) {
sub_tasks[i].execTime = (weights[i]/total_w) * ExecTime;
}
}
};
using Nodes = std::vector<Node>;
void generateEdges(Nodes& nodes) {
for (Node& node : nodes) {
// Create an edges to following nodes given 30% odds
for (size_t j = node.processid+1; j < nodes.size(); j++) {
if (odds(30)) {
node.follow = static_cast<ProcessID>(j);
break;
}
}
}
}
static std::ostream& operator<<(std::ostream& os, Node const& n);
int main() {
Nodes nodes;
for (auto id = 0; id < NoOfNodes; ++id) {
nodes.emplace_back(id);
}
generateEdges(nodes);
for (size_t h = 0; h < NoOfNodes; h++) {
if (h % 2 == 0)
continue;
nodes.emplace_back(nodes[h]);
nodes[h].sub_tasks.clear();
}
std::ofstream output("TG_Data_30NewEdges.txt");
for (auto& n : nodes) {
output << n << "=================\n";
}
std::cout << "DONE" << std::endl;
}
static std::ostream& operator<<(std::ostream& os, GPU_data const& cfg) {
return os
<< "Execution time: " << cfg.execTime << "\n"
<< "Copies: " << cfg.number_Copies << "\n"
<< "Memory: " << cfg.memory << "\n"
<< "Work-Items: " << cfg.workItems << "\n"
<< "Work-Groups: " << cfg.workGroups << "\n"
<< "Power: " << cfg.power_consumption << "\n";
}
static std::ostream& operator<<(std::ostream& os, Node const& n) {
os << "Node id: " << n.processid << "\n"
<< "Following Edge: " << n.follow << "\n"
<< "Transfer Data: " << n.transData << "\n"
<< "Node powerDraw: " << n.powerDraw() << "\n"
<< "Node PE: " << n.PEid << "\n";
if (n.isGPU()) {
os << "-------------------------------\n";
for (auto& cfg : n.sub_tasks) {
os << cfg << "++++++++++++++++++\n";
}
} else {
os << "Execution time: " << n.ExecTime << "\n";
}
return os;
}
Bản in, ví dụ:
DONE
Và tạo TG_Data_30NewEdges.txt:
Node id: 0
Following Edge: 1
Transfer Data: 1
Node powerDraw: 1020.61
Node PE: 1
-------------------------------
Execution time: 12.2428
Copies: 1
Memory: 1
Work-Items: 10
Work-Groups: 9
Power: 229.989
++++++++++++++++++
Execution time: 39.2756
Copies: 1
// ...
// 825 lines snipped
// ...
Copies: 3
Memory: 1
Work-Items: 3
Work-Groups: 9
Power: 235.512
++++++++++++++++++
=================
#define NoOfNodes 30
Tôi nghĩ sẽ tốt hơn nếu sử dụng một static constexpr
ở đây hơn là một macro tiền xử lý.
//which nodes will the edges connect to (Anywhere from among the following nodes, including the sink node) Sample.follow = (Sample.processid + 1) + (std::rand() % (29 - (Sample.processid) + 1)); if (Sample.follow == 30) { Sample.follow -= 1; }
Hằng số ở đâu 29
và 30
đến từ đâu? NoOfNodes
Thay vào đó, chúng có nên bắt nguồn từ không?
Có thể sử dụng <random>
thư viện C ++ sẽ tốt hơn std::rand()
.
CreateandAssignEdges()
và EdgeAssignment()
rất giống nhau - tôi nghĩ rằng sự trùng lặp có thể được giảm đáng kể.
//Sample->precede = rand() % NoOfEdges; //Sample->follow = rand() % NoOfEdges; ////Preceding and following edges of a node should not be the same. //while (Sample->precede > Sample->follow || Sample->precede == Sample->follow) //{ // //assign both edges again // Sample->follow = rand() % NoOfEdges; // Sample->precede = rand() % NoOfEdges; //}
Các đoạn mã được chú thích như thế này thường trở thành vấn đề, trở nên lỗi thời và không nhất quán khi mã xung quanh thay đổi. Xóa nó hoặc tìm cách đảm bảo nó được biên dịch và kiểm tra đơn vị với phần còn lại của mã.
myFile << "Node id: " << All_DAGs[i].processid << std::endl; myFile << "Following Edge: " << All_DAGs[i].follow << std::endl; myFile << "Transfer Data: " << All_DAGs[i].transData << std::endl; myFile << "Node PE: " << All_DAGs[i].PEid << std::endl;
Không có nhu cầu thực sự để tuôn ra myFile
từng tuyên bố - thích '\n'
để std::endl
cho tất cả những điều này (và hầu hết / tất cả những ứng dụng còn lại).