docs/cpp/sharder_8cc_source.html

// Copyright 2010-2021 Google LLC

// Licensed under the Apache License, Version 2.0 (the "License");

// you may not use this file except in compliance with the License.

// You may obtain a copy of the License at

//

//     http://www.apache.org/licenses/LICENSE-2.0

//

// Unless required by applicable law or agreed to in writing, software

// distributed under the License is distributed on an "AS IS" BASIS,

// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

// See the License for the specific language governing permissions and

// limitations under the License.


#include "ortools/pdlp/sharder.h"


#include <algorithm>

#include <cmath>

#include <cstdint>

#include <functional>

#include <vector>


#include "Eigen/Core"

#include "Eigen/SparseCore"

#include "absl/synchronization/blocking_counter.h"

#include "absl/time/time.h"

#include "ortools/base/logging.h"

#include "ortools/base/mathutil.h"

#include "ortools/base/threadpool.h"

#include "ortools/base/timer.h"


namespace operations_research::pdlp {


using ::Eigen::VectorXd;


Sharder::Sharder(const int64_t num_elements, const int num_shards,

                 ThreadPool* const thread_pool,

                 const std::function<int64_t(int64_t)>& element_mass)

    : thread_pool_(thread_pool) {

  CHECK_GE(num_elements, 0);

  if (num_elements == 0) {

    shard_starts_.push_back(0);

    return;

  }

  CHECK_GE(num_shards, 1);

  int64_t overall_mass = 0;

  for (int64_t elem = 0; elem < num_elements; ++elem) {

    overall_mass += element_mass(elem);

  }

  shard_starts_.push_back(0);

  int64_t this_shard_mass = element_mass(0);

  for (int64_t elem = 1; elem < num_elements; ++elem) {

    int64_t this_elem_mass = element_mass(elem);

    if (this_shard_mass + (this_elem_mass / 2) >= overall_mass / num_shards) {

      // this elem starts a new shard

      shard_masses_.push_back(this_shard_mass);

      shard_starts_.push_back(elem);

      this_shard_mass = this_elem_mass;

    } else {

      this_shard_mass += this_elem_mass;

    }

  }

  shard_starts_.push_back(num_elements);

  shard_masses_.push_back(this_shard_mass);

  CHECK_EQ(NumShards(), shard_masses_.size());

}


Sharder::Sharder(const int64_t num_elements, const int num_shards,

                 ThreadPool* const thread_pool)

    : thread_pool_(thread_pool) {

  CHECK_GE(num_elements, 0);

  if (num_elements == 0) {

    shard_starts_.push_back(0);

    return;

  }

  CHECK_GE(num_shards, 1);

  shard_starts_.reserve(num_shards + 1);

  shard_masses_.reserve(num_shards);

  for (int shard = 0; shard < num_shards; ++shard) {

    const int64_t this_shard_start = ((num_elements * shard) / num_shards);

    const int64_t next_shard_start =

        ((num_elements * (shard + 1)) / num_shards);

    if (next_shard_start - this_shard_start > 0) {

      shard_starts_.push_back(this_shard_start);

      shard_masses_.push_back(next_shard_start - this_shard_start);

    }

  }

  shard_starts_.push_back(num_elements);

  CHECK_EQ(NumShards(), shard_masses_.size());

}


Sharder::Sharder(const Sharder& other_sharder, const int64_t num_elements)

    // The std::max() protects against other_sharder.NumShards() == 0, which

    // will happen if other_sharder had num_elements == 0.

    : Sharder(num_elements, std::max(1, other_sharder.NumShards()),

              other_sharder.thread_pool_) {}


void Sharder::ParallelForEachShard(

    const std::function<void(const Shard&)>& func) const {

  if (thread_pool_) {

    absl::BlockingCounter counter(NumShards());

    VLOG(2) << "Starting ParallelForEachShard()";

    for (int shard_num = 0; shard_num < NumShards(); ++shard_num) {

      thread_pool_->Schedule([&, shard_num]() {

        WallTimer timer;

        if (VLOG_IS_ON(2)) {

          timer.Start();

        }

        func(Shard(shard_num, this));

        if (VLOG_IS_ON(2)) {

          timer.Stop();

          VLOG(2) << "Shard " << shard_num << " with " << ShardSize(shard_num)

                  << " elements and " << ShardMass(shard_num)

                  << " mass finished with "

                  << ShardMass(shard_num) /

                         std::max(int64_t{1}, absl::ToInt64Microseconds(

                                                  timer.GetDuration()))

                  << " mass/usec.";

        }

        counter.DecrementCount();

      });

    }

    counter.Wait();

    VLOG(2) << "Done ParallelForEachShard()";

  } else {

    for (int shard_num = 0; shard_num < NumShards(); ++shard_num) {

      func(Shard(shard_num, this));

    }

  }

}


double Sharder::ParallelSumOverShards(

    const std::function<double(const Shard&)>& func) const {

  VectorXd local_sums(NumShards());

  ParallelForEachShard([&](const Sharder::Shard& shard) {

    local_sums[shard.Index()] = func(shard);

  });

  return local_sums.sum();

}


bool Sharder::ParallelTrueForAllShards(

    const std::function<bool(const Shard&)>& func) const {

  // Recall std::vector<bool> is not thread-safe.

  std::vector<int> local_result(NumShards());

  ParallelForEachShard([&](const Sharder::Shard& shard) {

    local_result[shard.Index()] = static_cast<int>(func(shard));

  });

  return std::all_of(local_result.begin(), local_result.end(),

                     [](const int v) { return static_cast<bool>(v); });

}


VectorXd TransposedMatrixVectorProduct(

    const Eigen::SparseMatrix<double, Eigen::ColMajor, int64_t>& matrix,

    const VectorXd& vector, const Sharder& sharder) {

  CHECK_EQ(vector.size(), matrix.rows());

  VectorXd answer(matrix.cols());

  sharder.ParallelForEachShard([&](const Sharder::Shard& shard) {

    shard(answer) = shard(matrix).transpose() * vector;

  });

  return answer;

}


void AddScaledVector(const double scale, const VectorXd& increment,

                     const Sharder& sharder, VectorXd& dest) {

  sharder.ParallelForEachShard([&](const Sharder::Shard& shard) {

    shard(dest) += scale * shard(increment);

  });

}


void AssignVector(const VectorXd& vec, const Sharder& sharder, VectorXd& dest) {

  dest.resize(vec.size());

  sharder.ParallelForEachShard(

      [&](const Sharder::Shard& shard) { shard(dest) = shard(vec); });

}


VectorXd CloneVector(const VectorXd& vec, const Sharder& sharder) {

  VectorXd dest;

  AssignVector(vec, sharder, dest);

  return dest;

}


// Like vector = vector.cwiseProduct(scale).

void CoefficientWiseProductInPlace(const VectorXd& scale,

                                   const Sharder& sharder, VectorXd& dest) {

  sharder.ParallelForEachShard([&](const Sharder::Shard& shard) {

    shard(dest) = shard(dest).cwiseProduct(shard(scale));

  });

}


// Like vector = vector.cwiseQuotient(scale).

void CoefficientWiseQuotientInPlace(const VectorXd& scale,

                                    const Sharder& sharder, VectorXd& dest) {

  sharder.ParallelForEachShard([&](const Sharder::Shard& shard) {

    shard(dest) = shard(dest).cwiseQuotient(shard(scale));

  });

}


double Dot(const VectorXd& v1, const VectorXd& v2, const Sharder& sharder) {

  return sharder.ParallelSumOverShards(

      [&](const Sharder::Shard& shard) { return shard(v1).dot(shard(v2)); });

}


double LInfNorm(const VectorXd& vector, const Sharder& sharder) {

  VectorXd local_max(sharder.NumShards());

  sharder.ParallelForEachShard([&](const Sharder::Shard& shard) {

    local_max[shard.Index()] = shard(vector).lpNorm<Eigen::Infinity>();

  });

  return local_max.lpNorm<Eigen::Infinity>();

}


double L1Norm(const VectorXd& vector, const Sharder& sharder) {

  return sharder.ParallelSumOverShards(

      [&](const Sharder::Shard& shard) { return shard(vector).lpNorm<1>(); });

}


double SquaredNorm(const VectorXd& vector, const Sharder& sharder) {

  return sharder.ParallelSumOverShards(

      [&](const Sharder::Shard& shard) { return shard(vector).squaredNorm(); });

}


double Norm(const VectorXd& vector, const Sharder& sharder) {

  return std::sqrt(SquaredNorm(vector, sharder));

}


double SquaredDistance(const VectorXd& vector1, const VectorXd& vector2,

                       const Sharder& sharder) {

  return sharder.ParallelSumOverShards([&](const Sharder::Shard& shard) {

    return (shard(vector1) - shard(vector2)).squaredNorm();

  });

}


double Distance(const VectorXd& vector1, const VectorXd& vector2,

                const Sharder& sharder) {

  return std::sqrt(SquaredDistance(vector1, vector2, sharder));

}


double ScaledLInfNorm(const VectorXd& vector, const VectorXd& scale,

                      const Sharder& sharder) {

  VectorXd local_max(sharder.NumShards());

  sharder.ParallelForEachShard([&](const Sharder::Shard& shard) {

    local_max[shard.Index()] =

        shard(vector).cwiseProduct(shard(scale)).lpNorm<Eigen::Infinity>();

  });

  return local_max.lpNorm<Eigen::Infinity>();

}


double ScaledSquaredNorm(const VectorXd& vector, const VectorXd& scale,

                         const Sharder& sharder) {

  return sharder.ParallelSumOverShards([&](const Sharder::Shard& shard) {

    return shard(vector).cwiseProduct(shard(scale)).squaredNorm();

  });

}


double ScaledNorm(const VectorXd& vector, const VectorXd& scale,

                  const Sharder& sharder) {

  return std::sqrt(ScaledSquaredNorm(vector, scale, sharder));

}


VectorXd ScaledColLInfNorm(

    const Eigen::SparseMatrix<double, Eigen::ColMajor, int64_t>& matrix,

    const VectorXd& row_scaling_vec, const VectorXd& col_scaling_vec,

    const Sharder& sharder) {

  CHECK_EQ(matrix.cols(), col_scaling_vec.size());

  CHECK_EQ(matrix.rows(), row_scaling_vec.size());

  VectorXd answer(matrix.cols());

  sharder.ParallelForEachShard([&](const Sharder::Shard& shard) {

    auto matrix_shard = shard(matrix);

    auto col_scaling_shard = shard(col_scaling_vec);

    for (int64_t col_num = 0; col_num < shard(matrix).outerSize(); ++col_num) {

      double max = 0.0;

      for (decltype(matrix_shard)::InnerIterator it(matrix_shard, col_num); it;

           ++it) {

        max = std::max(max, std::abs(it.value() * row_scaling_vec[it.row()]));

      }

      shard(answer)[col_num] = max * std::abs(col_scaling_shard[col_num]);

    }

  });

  return answer;

}


VectorXd ScaledColL2Norm(

    const Eigen::SparseMatrix<double, Eigen::ColMajor, int64_t>& matrix,

    const VectorXd& row_scaling_vec, const VectorXd& col_scaling_vec,

    const Sharder& sharder) {

  CHECK_EQ(matrix.cols(), col_scaling_vec.size());

  CHECK_EQ(matrix.rows(), row_scaling_vec.size());

  VectorXd answer(matrix.cols());

  sharder.ParallelForEachShard([&](const Sharder::Shard& shard) {

    auto matrix_shard = shard(matrix);

    auto col_scaling_shard = shard(col_scaling_vec);

    for (int64_t col_num = 0; col_num < shard(matrix).outerSize(); ++col_num) {

      double sum_of_squares = 0.0;

      for (decltype(matrix_shard)::InnerIterator it(matrix_shard, col_num); it;

           ++it) {

        sum_of_squares +=

            MathUtil::Square(it.value() * row_scaling_vec[it.row()]);

      }

      shard(answer)[col_num] =

          std::sqrt(sum_of_squares) * std::abs(col_scaling_shard[col_num]);

    }

  });

  return answer;

}


bool IsDiagonal(

    const Eigen::SparseMatrix<double, Eigen::ColMajor, int64_t>& matrix,

    const Sharder& sharder) {

  return sharder.ParallelTrueForAllShards([&](const Sharder::Shard& shard) {

    auto matrix_shard = shard(matrix);

    const int64_t col_offset = sharder.ShardStart(shard.Index());

    for (int64_t col_idx = 0; col_idx < matrix_shard.outerSize(); ++col_idx) {

      for (decltype(matrix_shard)::InnerIterator it(matrix_shard, col_idx); it;

           ++it) {

        if (it.row() != (col_offset + it.col())) return false;

      }

    }

    return true;

  });

}


}  // namespace operations_research::pdlp

max
int64_t max
Definition: alldiff_cst.cc:140

logging.h

CHECK_EQ
#define CHECK_EQ(val1, val2)
Definition: base/logging.h:703

CHECK_GE
#define CHECK_GE(val1, val2)
Definition: base/logging.h:707

VLOG
#define VLOG(verboselevel)
Definition: base/logging.h:984

WallTimer
Definition: timer.h:23

WallTimer::Start
void Start()
Definition: timer.h:31

WallTimer::Stop
void Stop()
Definition: timer.h:39

WallTimer::GetDuration
absl::Duration GetDuration() const
Definition: timer.h:48

operations_research::MathUtil::Square
static T Square(const T x)
Definition: mathutil.h:101

operations_research::ThreadPool
Definition: threadpool.h:26

operations_research::ThreadPool::Schedule
void Schedule(std::function< void()> closure)
Definition: threadpool.cc:77

operations_research::pdlp::Sharder::Shard
Definition: sharder.h:55

operations_research::pdlp::Sharder::Shard::Index
int Index() const
Definition: sharder.h:127

operations_research::pdlp::Sharder
Definition: sharder.h:34

operations_research::pdlp::Sharder::Sharder
Sharder(int64_t num_elements, int num_shards, ThreadPool *thread_pool, const std::function< int64_t(int64_t)> &element_mass)
Definition: sharder.cc:35

operations_research::pdlp::Sharder::ParallelSumOverShards
double ParallelSumOverShards(const std::function< double(const Shard &)> &func) const
Definition: sharder.cc:131

operations_research::pdlp::Sharder::ParallelForEachShard
void ParallelForEachShard(const std::function< void(const Shard &)> &func) const
Definition: sharder.cc:97

operations_research::pdlp::Sharder::ParallelTrueForAllShards
bool ParallelTrueForAllShards(const std::function< bool(const Shard &)> &func) const
Definition: sharder.cc:140

operations_research::pdlp::Sharder::ShardSize
int64_t ShardSize(int shard) const
Definition: sharder.h:186

operations_research::pdlp::Sharder::NumShards
int NumShards() const
Definition: sharder.h:181

operations_research::pdlp::Sharder::ShardStart
int64_t ShardStart(int shard) const
Definition: sharder.h:192

operations_research::pdlp::Sharder::ShardMass
int64_t ShardMass(int shard) const
Definition: sharder.h:198

mathutil.h

operations_research::pdlp
Definition: iteration_stats.cc:40

operations_research::pdlp::SquaredNorm
double SquaredNorm(const VectorXd &vector, const Sharder &sharder)
Definition: sharder.cc:215

operations_research::pdlp::ScaledNorm
double ScaledNorm(const VectorXd &vector, const VectorXd &scale, const Sharder &sharder)
Definition: sharder.cc:253

operations_research::pdlp::Dot
double Dot(const VectorXd &v1, const VectorXd &v2, const Sharder &sharder)
Definition: sharder.cc:197

operations_research::pdlp::SquaredDistance
double SquaredDistance(const VectorXd &vector1, const VectorXd &vector2, const Sharder &sharder)
Definition: sharder.cc:224

operations_research::pdlp::LInfNorm
double LInfNorm(const VectorXd &vector, const Sharder &sharder)
Definition: sharder.cc:202

operations_research::pdlp::Distance
double Distance(const VectorXd &vector1, const VectorXd &vector2, const Sharder &sharder)
Definition: sharder.cc:231

operations_research::pdlp::TransposedMatrixVectorProduct
VectorXd TransposedMatrixVectorProduct(const Eigen::SparseMatrix< double, Eigen::ColMajor, int64_t > &matrix, const VectorXd &vector, const Sharder &sharder)
Definition: sharder.cc:151

operations_research::pdlp::ScaledLInfNorm
double ScaledLInfNorm(const VectorXd &vector, const VectorXd &scale, const Sharder &sharder)
Definition: sharder.cc:236

operations_research::pdlp::ScaledSquaredNorm
double ScaledSquaredNorm(const VectorXd &vector, const VectorXd &scale, const Sharder &sharder)
Definition: sharder.cc:246

operations_research::pdlp::ScaledColLInfNorm
VectorXd ScaledColLInfNorm(const Eigen::SparseMatrix< double, Eigen::ColMajor, int64_t > &matrix, const VectorXd &row_scaling_vec, const VectorXd &col_scaling_vec, const Sharder &sharder)
Definition: sharder.cc:258

operations_research::pdlp::AddScaledVector
void AddScaledVector(const double scale, const VectorXd &increment, const Sharder &sharder, VectorXd &dest)
Definition: sharder.cc:162

operations_research::pdlp::CoefficientWiseProductInPlace
void CoefficientWiseProductInPlace(const VectorXd &scale, const Sharder &sharder, VectorXd &dest)
Definition: sharder.cc:182

operations_research::pdlp::CoefficientWiseQuotientInPlace
void CoefficientWiseQuotientInPlace(const VectorXd &scale, const Sharder &sharder, VectorXd &dest)
Definition: sharder.cc:190

operations_research::pdlp::ScaledColL2Norm
VectorXd ScaledColL2Norm(const Eigen::SparseMatrix< double, Eigen::ColMajor, int64_t > &matrix, const VectorXd &row_scaling_vec, const VectorXd &col_scaling_vec, const Sharder &sharder)
Definition: sharder.cc:280

operations_research::pdlp::L1Norm
double L1Norm(const VectorXd &vector, const Sharder &sharder)
Definition: sharder.cc:210

operations_research::pdlp::CloneVector
VectorXd CloneVector(const VectorXd &vec, const Sharder &sharder)
Definition: sharder.cc:175

operations_research::pdlp::IsDiagonal
bool IsDiagonal(const Eigen::SparseMatrix< double, Eigen::ColMajor, int64_t > &matrix, const Sharder &sharder)
Definition: sharder.cc:304

operations_research::pdlp::Norm
double Norm(const VectorXd &vector, const Sharder &sharder)
Definition: sharder.cc:220

operations_research::pdlp::AssignVector
void AssignVector(const VectorXd &vec, const Sharder &sharder, VectorXd &dest)
Definition: sharder.cc:169

std
STL namespace.

sharder.h

threadpool.h

timer.h

VLOG_IS_ON
#define VLOG_IS_ON(verboselevel)
Definition: vlog_is_on.h:44