2019-01-01から1年間の記事一覧

過去JJUG CCCの発表資料一覧

個人的にまとまってくれてた方が見返しやすいので作成 2019年秋 2019年春 2018年秋 2018年春 2017年秋 2017年春 from old Java to modern Java (2017) データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 非機能要件とSpring Boot Spring ❤️ Kot…

Intel DL boostを使おうとした続き

先日の記事ですが、問題解決できました。 #include <immintrin.h> #include <stdio.h> int main() { int8_t __attribute__((aligned(64))) op1_int8[64]; int8_t __attribute__((aligned(64))) op2_int8[64]; int __attribute__((aligned(64))) op3_int[16]; int __attribute__((al</stdio.h></immintrin.h>…

Intel DL boostを使おうとしたけど

EC2 c5.12xlarge インスタンスでは使えるはずと思って試しました。 Intelのサイトを参考に sudo apt install gcc-8 clang-8 #include <immintrin.h> #include <stdio.h> int main() { int8_t __attribute__((aligned(64))) op1_int8[64]; int8_t __attribute__((aligned(64))) op2_</stdio.h></immintrin.h>…

「線形代数の基礎」をJavaで実装してみる2

「線形代数の基礎」はこちらのページです。 https://tutorials.chainer.org/ja/05_Basics_of_Linear_Algebra.html スカラ値の乗算 ベクトル public Vector multiply(float scalar) { float[] scalars = new float[this.scalars.length]; for (int i = 0;i < …

「線形代数の基礎」をJavaで実装してみる

「線形代数の基礎」はこちらのページです。 https://tutorials.chainer.org/ja/05_Basics_of_Linear_Algebra.html テンソル public class Tensor { protected final int order; public Tensor(int order) { this.order = order; } } public class LinearAlge…

近似計算の比較

計算をするときいくつかの処理を高速化のために近似値計算で済ます方法があります。 こちらのブログで計算方法が紹介されているので拝借します。 https://martin.ankerl.com/2007/10/04/optimized-pow-approximation-for-java-and-c-c/ package math; import…

GraalVMのnative-imageを試す

https://www.graalvm.org/docs/getting-started/ こちらの手順に沿ってダウンロードして、エイリアスの設定 alias java8=~/graalvm-ce-19.2.0.1/Contents/Home/bin/java alias javac8=~/graalvm-ce-19.2.0.1/Contents/Home/bin/javac 以下のソースで実験 // …

Chainer 6.4.0 リリース

6.4.0 https://github.com/chainer/chainer/releases/tag/v6.4.0 現在は7.0.0の開発がメインのようで主に7.0.0からのバックポートとなっています。

Java Vector API を試す

https://nowokay.hatenablog.com/entry/2019/09/05/015537 こちらの記事を参考にビルドします。 CのコードとJavaのコードを比較していきます。 # vector.h float dotProduct512(float* vec1, float* vec2, int num); float dotProduct256(float* vec1, float…

AVX512をEC2で試す

今回はEC2のc5.largeインスタンスを使います。 CPU情報は $ cat /proc/cpuinfo processor : 0 vendor_id : GenuineIntel cpu family : 6 model : 85 model name : Intel(R) Xeon(R) Platinum 8124M CPU @ 3.00GHz stepping : 4 microcode : 0x200005e cpu MH…

V言語 0.1.19/0.1.20 リリース

0.1.20 https://github.com/vlang/v/releases/tag/0.1.20 JavaScriptエンジンで実行をサポート Android Termux上での実行をサポート 0.1.19 https://github.com/vlang/v/releases/tag/0.1.19 新しいMySQLモジュール ggモジュールがUnicode描画をサポート Git…

再度AV1を含めたエンコード品質の比較

前回の記事でPSNRの比較をしたのですが、指定したビットレートに対し実際のビットレートが乖離していることがわかったので 今回は極力して通りになる様調整しました。NVEncは乖離が激しかった為計測していません。 またAV1も使用しています。 環境 Windows 1…

動画コーデックの画質の比較

ffmpegを使用しPSNRの値を比較しました。 環境 Windows 10 / Core i7 9750H / Geforce GTX 1660 Ti エンコードオプションは以下のように設定しました。 ffmpeg -y -i input.mp4 -c:v libx264 -b:v 100k out_libx264.mp4 ffmpeg -y -i input.mp4 -c:v libx265…

Docker CE 18.09.9 リリース

18.09.9がリリースされました。 https://github.com/docker/docker-ce/releases/tag/v18.09.9

oidn - ノイズ削除ライブラリを試す

ノイズを削除するライブラリを使用してみたので、さらっと紹介します。 Intel® Open Image Denoise ビルドします。 git clone --recursive https://github.com/OpenImageDenoise/oidn.git mkdir oidn/build cd oidn/build cmake -DCMAKE_CXX_COMPILER=clang+…

Chainer 6.3.0 リリース

v6.3.0 https://github.com/chainer/chainer/releases/tag/v6.3.0 修正点 スナップショットの自動管理機能 FP16を使用したときにオーバーフローする問題を修正 F.average をバックエンド並みの精度に 真偽値評価時のtype_checkのエラーメッセージの修正 type…

kubernetesのリリース 8/20

kubernetesのマイナーアップデートになります。 v1.13.10 https://github.com/kubernetes/kubernetes/releases/tag/v1.13.10 v1.14.6 https://github.com/kubernetes/kubernetes/releases/tag/v1.14.6 v1.15.3 https://github.com/kubernetes/kubernetes/rel…

Tensorflowのベンチマークを試してみる その2

新しくノートPCを購入したので、再度TensorFlowベンチマークを試してみようと思います。 環境 OS:Windows10 CPU: Core i7 9750H GPU: Geforce GTX1660 Ti こちらのページを参考にTensorflowをインストールしました。 CUDAのバージョンは10.1ではなく10.0を使…

確率的プログラミング言語をいくつか紹介

確率的プログラミング言語とは確率的決定モデルを言語上から扱いやすくしたものです。 Python系だと bayesloop PyMC4 pomegranate PyLFPPL Compiler Edward TensorFlow Probability Pyro Julia系だと MIT-Picture Turing.jl Gen それ以外だと Anglican Infer…

SpringBoot最新リリース

1.5.22.RELEASE https://github.com/spring-projects/spring-boot/releases/tag/v1.5.22.RELEASE MongoDBへの接続にHTTPが優先して使われてしまう問題を修正 存在していないjetty-infinispanを使用してしまう問題を修正 2.1.7.RELEASE https://github.com/sp…

いくつかのクラスタリング実装サンプルを紹介

クラスタリングのアルゴリズムを探していた時に一通り実装されているサンプルを発見したので試してみます。 https://github.com/haifengl/smile BIRCH(balanced iterative reducing and clustering using hierarchies) BIRCHは階層的クラスタリングの一つ。…

Tensorflowのベンチマークを試してみる

こちらのベンチマークを試してみます。ただし今の所GPU環境が無いためCPUのみです。 https://github.com/tensorflow/benchmarks 環境: MacbookPro '13 Core i5-8259U CPU 2.30GHz Python 3.6.6 CPU用に以下のコマンド引数を用います。 python tf_cnn_benchm…

NumPy 1.17.0 リリース

https://github.com/numpy/numpy/releases/tag/v1.17.0 ざっくりと randomモジュール:4機能に対して拡張可能、並列実行時のシード生成を改善 FFTの実装をfftpackからpocketfftに変更 radixソートとtimsortのメソッドを追加 NumPyの関数をオーバーライド可…

2019~2020年CPU・GPUの理論Flops値

FMA命令を使うと1度に積和算の2ops計算できます。それにコア数や処理装置数と最後に周波数を掛けています。 Intel CPUCore i9 9900K2 ops * 8 width * 8 core * 3.6Ghz = 460.8Gflops Core i9-9980XE(Skylake-X)2 ops * 16 width * 18 core * 3.0Ghz = 1,728…